Gene Nwi_1161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_1161
Symbol
ID	3675796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	1272467
End bp	1273642
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	65%
IMG OID	637712711
Product	Phage portal protein, HK97
Protein accession	YP_317775
Protein GI	75675354
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.255409
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTTGC GCTTCAAAAA CATGTTTGCT CCGCCCGAGA CAAAAGCCAG TCGCACGGCC 
AGGCTGCTCG CCTTCGAGAG CGGCGGCCGC GCGCGCTGGA CGCCACGCGA CTACGCGGCG 
CTGGCCCGCG AAGGCTATCT GGCCAATCCC GTCGTACATC GCGCGGTGCG GCTGATCGCG 
GAGAATGTGG CGTCTTGCAG CTACCTCGTG TTCGAGGGCG CGCAGGAACG CGAGGCGCAT 
CCGCTATCGT TGCTGCTCAC GCGTCCGAAT ACGCGGCAGG ACGGCGGCGC GTTTCTCGAA 
ACGCTGGTGT CGCATCTGTT GCTGGCGGGG AACGCCTATG TCGAAACAGT CGCGCTCGAC 
GGGGCGGTTC GCGAACTTCA CGCGCTGCGT CCCGATCGCA TGAAGGTGGT GCCGGGTCCC 
GAGGGTTGGG CGGAAGCGTA TGAGTACAGC GTCGGCGGGC GCAGCGTGCG CTTTGATCAG 
GCCTCATCCG TCGTGCCACC GATCCTGCAC CTGACGTTCT TTCATCCGCT CGACGATCAC 
TACGGTCTTG CGCCGATCGA ATCCGCCGCC GTCGCCATCG ACACCCATAA CGCCGGATCG 
AAATGGAATA AGGCGCTGCT CGACAACGCC GCGCGGCCGT CCGGCGCGCT GGTCTATGCC 
GGGCCGGAGG GCGCGGTGCT CTCGGATTCA CAGTTCGACC GGCTCAAGCG CGAGTTGACC 
GATACCTATC AGGGCGCGGT GAACGCGGGC CGGCCGCTGC TGCTCGAAGG CGGACTCGAT 
TGGAAAGCGA TGTCGCTGAC GCCGAAGGAC ATGGATTTCC TGGAGGCCAA GCACACGGCC 
GCGCGCGAGA TCGCGCTCGC TTTCGGCGTG CCGCCGATGA TGCTCGGTAT TCCCGGCGAC 
AACACCTACG CCAATTTCCT GGAAGCCAAT CGCTGCTTCT TTCGCCAGAC CGTGTTGCCG 
CTGGCGTCGC GTATCGGCAA TTCGTTCGCG CAGTGGCTGT CGCCGCAGTT CGGCGAAAGC 
ATCCGCGTCG TCGTCGACAC CGACAAAATG GACGCGCTCG CCGCCGATCG TACGGCGTTG 
TGGGAACGGG TCAGCGATGC GGCCTTTCTC ACGCTCAACG AAAAGCGCGA GGCGGTCGGC 
TATGCGCCGA TCGAGGGCGG CGACCGCTTG GAGTGA

Protein sequence

MRLRFKNMFA PPETKASRTA RLLAFESGGR ARWTPRDYAA LAREGYLANP VVHRAVRLIA 
ENVASCSYLV FEGAQEREAH PLSLLLTRPN TRQDGGAFLE TLVSHLLLAG NAYVETVALD 
GAVRELHALR PDRMKVVPGP EGWAEAYEYS VGGRSVRFDQ ASSVVPPILH LTFFHPLDDH 
YGLAPIESAA VAIDTHNAGS KWNKALLDNA ARPSGALVYA GPEGAVLSDS QFDRLKRELT 
DTYQGAVNAG RPLLLEGGLD WKAMSLTPKD MDFLEAKHTA AREIALAFGV PPMMLGIPGD 
NTYANFLEAN RCFFRQTVLP LASRIGNSFA QWLSPQFGES IRVVVDTDKM DALAADRTAL 
WERVSDAAFL TLNEKREAVG YAPIEGGDRL E