Gene Noc_0540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_0540
Symbol
ID	3706732
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	578235
End bp	579740
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	54%
IMG OID	637737048
Product	ABC transporter inner membrane/substrate-binding proteins
Protein accession	YP_342590
Protein GI	77164065
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1174] ABC-type proline/glycine betaine transport systems, permease component [COG1732] Periplasmic glycine betaine/choline-binding (lipo)protein of an ABC-type transport system (osmoprotectant binding protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGGCC GCACAGTGAA TAAAGCAAGC CTTGCTTTGG CTTTGTGGCT GCTATTCTCG 
GGATGCTTGG CCGATTCCGC GGTGATCGTT GGCTCCAAGA AGTTTACGGA ATCCATTCTT 
TTGGGTGAGC TGGTAGTTCA GCAGATACGG AGTGCGGGCG TGAACGCGAT CCATCGCCGG 
GAACTGGGGG GATCGCGGGT TCTTTGGAAC GCCTTGCTGA CCGGTGAAAT CGATATTTAT 
CCTGAATATA CTGGCACGCT CTATTACGAA ATTTTTTCCC GGCAGGTGAC CGAAGAAGCC 
GAACTGCGCC GCCTTTTAGT GGCCCAGGGA ATTGAGATGA GCCGTCCCTT GGGATTCAAT 
AATACGTATG CTTTGGGAAT GAAAGAAGCG GTTGCCGAGC GGCTCAATAT TCGTAAGATT 
TCAGATCTGG TTAGACATCC AGAGCTAGTG CTGGGATTTA GTAATGAGTT TATGGCCCGG 
GCTGACGGAT GGCCGGGTCT GCGTACTCGC TATGGGTTGC CCCAACGCCA GGTCAGCGGA 
TTGGATCATG ATCTCGCTTA CCGGGGACTA GCGCAGGGTT CCTTGCAGGT GATTGATCTC 
TACTCGACCG ATGCTGAAAT TGATTATTAT GGATTGCGCG TACTAGAAGA TGATCGTCAT 
TACTTTCCCG ACTATAAAGC CCTATTGCTT TACCGGCGTG ACTTGCTGAA ACAGGCGCCA 
GAGGCAGTGA CTGCCTTACA TTCTTTGGAG GGGCGCCTTG ATTCGGCAAG CATGGCCGCC 
ATGAATGCCC AGGTTAAGCT GGAGCGCGTC CCCGATTTCC AGGTAGCCGG AAATTTTCTG 
GAACAAACTT TTGGCCATCG CCCGCAAGCC TCTCCGGTAA CCGCCTGGCA GCGTTTTTAC 
CGCCATACCA AGGAGCACTT GGTTTTGGTC GGCATTTCCC TGACAAGCGC CATTGTTGTC 
GCCATCCCGC TCGGAGTTAT CGCAGCCTAC CGGCCCCGGC TAGGGTCGAT TATCTTGAGT 
ATAGCGGGGA TTATTCAAAC TATTCCCGCG CTGGCCTTGC TGGTTTTCAT GATTCCTCTC 
CTTGGCATTG GCGGTCCGCC GGCGGTTGTG GCCTTATTCC TGTACAGTCT TTTACCCATC 
CTGCGCAATA CCCATACCGG GTTGCATGAT ATTTCCCCTC AGCTTCGAGA ATCGGCAGTA 
GCGCTGGGTC TTTCAACGGG GGCCAGGCTG CGTTTAGTGG AACTGCCCAT GGCCTCCCGC 
GCTATTTTGG CGGGTATTAA AACCTCAGCG GTGATCAATG TGGGCACGGC TACCCTGGGT 
GCTTTAATCG GCGCCGGGGG ATATGGGCAA CCTATATTGA CTGGAATTCG CTTGGATGAC 
GTGAGTCTTA TTTTGGAAGG AGCCATTCCT GCCGCCGGAC TGGCCATGCT GGTGCAAGGG 
CTGTTTGAGT GGGCGGATCG AGCCATAGTC CCTAAAGGGC TGCGGTTGGC AGAGCGGAAA 
AGATAA

Protein sequence

MEGRTVNKAS LALALWLLFS GCLADSAVIV GSKKFTESIL LGELVVQQIR SAGVNAIHRR 
ELGGSRVLWN ALLTGEIDIY PEYTGTLYYE IFSRQVTEEA ELRRLLVAQG IEMSRPLGFN 
NTYALGMKEA VAERLNIRKI SDLVRHPELV LGFSNEFMAR ADGWPGLRTR YGLPQRQVSG 
LDHDLAYRGL AQGSLQVIDL YSTDAEIDYY GLRVLEDDRH YFPDYKALLL YRRDLLKQAP 
EAVTALHSLE GRLDSASMAA MNAQVKLERV PDFQVAGNFL EQTFGHRPQA SPVTAWQRFY 
RHTKEHLVLV GISLTSAIVV AIPLGVIAAY RPRLGSIILS IAGIIQTIPA LALLVFMIPL 
LGIGGPPAVV ALFLYSLLPI LRNTHTGLHD ISPQLRESAV ALGLSTGARL RLVELPMASR 
AILAGIKTSA VINVGTATLG ALIGAGGYGQ PILTGIRLDD VSLILEGAIP AAGLAMLVQG 
LFEWADRAIV PKGLRLAERK R