Gene Nham_0202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_0202
Symbol
ID	4030662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	-
Start bp	225903
End bp	226823
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	64%
IMG OID	637968737
Product	extracellular solute-binding protein
Protein accession	YP_575562
Protein GI	92115833
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.725948
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACCAC AGATTACTGT TTCCGCCAAC GAAAGATTGA TCCGCCGCCT TGCGACCATG 
CTGGGTTGTA TGCTGGTCGC CGGCTGGATG CTGGTTTTGG GAGCAGCGGT CGACGATGCG 
CGCGCGCAAG CCGCAGCGAA GACCGCCACC GTCGCGCCGC AGGCGGTGCC GGGCTTCTGG 
GATCCGCGCC GCCGTCCGGA TCGCCCCGAT CTGTCACGCA TCACCGTGAT CCGCTTTCTG 
ACCGAGACCG ACTATCCGCC CTTCAACTTC ACCGGTCCCG ACGGCAATCC GGCCGGCTTC 
AATGTCGATC TGGCGCGCGC CCTGTGCGAG GAAATCAAGA TCACCTGCAC GATTCAGATG 
CGGCGCTTCG AGACGCTGGT GGACGCGCTC ACCAGCAACC GCGGCGACGC CATCATCGCC 
TCGCTCGCGG TAACGCCGGA GCTGCGCAAG CGGGTGGACT TCACCGACCC GTACTATCGA 
ACGCCGGCGC GATTCGTGTC GCGGCGCGAC GCCGTGATGG CCGAGGTGCG CCCGGAATAT 
CTCGAGGGCA AGAAGGTCGG CGTGATCGCA GGGTCGGCGC ACGAGGCCTA TCTCAAGGTC 
TTCTTCACCG ATGCCGAACT CCACACCTAT CCGAACGACG AGGCGCTGCG GCAGGCGCTG 
CGGCGGGGCG AAGTCGACTT CATTTTCGGC GACGCCATTT CACTGGCGTT CTGGATCAAC 
GGCACCGATT CGGAAGGCTG CTGCGCCTTC AGCGGCGGCC CCTTTGTCGA GAGCCGCTAT 
TTTGGCGAAG GCGTCGGCAT CGCGGTGAAA AAGGGCAATG ACGTGCTGCG TCAGGCGCTG 
AACTGGGCGC TGTTCCGGGT CTGGGAAAAA GGCCGCTATA CCGACCTGTG GTTGCGGTAT 
TTTTCCGTCA GTCCGTTTTA G

Protein sequence

MQPQITVSAN ERLIRRLATM LGCMLVAGWM LVLGAAVDDA RAQAAAKTAT VAPQAVPGFW 
DPRRRPDRPD LSRITVIRFL TETDYPPFNF TGPDGNPAGF NVDLARALCE EIKITCTIQM 
RRFETLVDAL TSNRGDAIIA SLAVTPELRK RVDFTDPYYR TPARFVSRRD AVMAEVRPEY 
LEGKKVGVIA GSAHEAYLKV FFTDAELHTY PNDEALRQAL RRGEVDFIFG DAISLAFWIN 
GTDSEGCCAF SGGPFVESRY FGEGVGIAVK KGNDVLRQAL NWALFRVWEK GRYTDLWLRY 
FSVSPF