Gene Nham_1206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_1206
Symbol
ID	4032297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	+
Start bp	1361321
End bp	1362661
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	58%
IMG OID	637969686
Product	twin-arginine translocation pathway signal
Protein accession	YP_576495
Protein GI	92116766
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATCCC ATGCATCTCG TCGCTATGGC CTATCGCGCC GCGACGTCAT CAAGACCGCT 
GTGGGTGCGG CCGCCACCGT CGGCCCATTC TTCCATGTTG CGCCGGCTCG TGCGGCCAAG 
ACGCTGAAGA TCCTGCAGTG GAGCCACTTC GTCCCCGGCT ACGACAAGTG GTTCAACAAC 
ACCTACATCA AGGAATGGGG CGCCCAGCAT GGCACCGAAG TGGTCGTCGA CAACATCAAC 
CTCGGCCTGA TCCCTTCGCG TGCGGCAGCG GAAGTATCGG CGCAGAAGGG GCATGACCTC 
GTGATGTTCC TCGCCCCGCC TTCGGTTTAC GAAGAGCAGG TCGTCGACAT GAAGGATGTC 
TACGACGCGT GCGAGAAAAA GTACGGCAAG CCGATCGATC TCGCCGTAAA GAGTACCTAC 
AACCCCAAGA CCCGGAAGTA CTTCGCGTTC TCCGACAGCT TCGTCCCCGA TCCTGTCAAC 
TACCGCTCGG ATCTTTGGGG CGACGTCGGC ATGAAGCCCG ATAGCTGGGA CAATGTCCGC 
ATCGGCGGCA AGAAGATCAA GGACAAGACC GGAATCCCGG TCGGCATCGG CCTCTCCGCC 
GAGCTCGACA CCGCGATGGC AATGCGCGCG ATCATGTATT CATTCGGCGC GCACGAGCAG 
GACGTCGATG GCAATCTCGC GATCAATTCC AAGGAAACCC TCGAAGCCCT CAAATTCGTC 
AAAGCGCTGT TCGAGGAAAC GGAAACGCCC GAAGTTTTCG CGTGGGATCC GTCGTCGAAC 
AATCGGCAGA TGCTCGCCGG CAGGTCATCT CTGGTGCTGA ACGCGATTTC GGTCACGCGC 
ACGGGCGAAA ACGACAAGAT GCCGATCCAC GAGAAGATTG CGCTCGCCAA GCCGCCGAAA 
GGCTCGGTTC GGCAGATCGG CCTTGAGCAC GTGATGGATT GCTACGTGAT CTGGAAATTC 
TCCGAAAACA TTGACGGCGC AAAAATGTTC CTGGTCGACT ACATCGACAA CTTCAAGCAG 
GGCTTCATGG CCAGCGAGTA TTACAACTTC CCCTGCTTCT CGAAGACCGT TCCCGACCTG 
GCACAGATCA TCTCCAGGGA TTCCAAGGCC GTGCCGCCGG ACAAGTACGC GGTGCTTTCG 
GACGTGCTCG ATTGGGCAAC TAACGTCGGC TATCCCGGCT ACTCCAACGC CGCGATCGAC 
GAAACTTTCA ACACCTGGGC GATCAATACC ATGTTCGCAG AAGCTGCCGC GGGCGCCGAA 
ACTCCGGAGA ACGCTCTCAA GCGGGCGGAA GCCAAGATGA AGGCGATCTG GGCCAAATGG 
AAAGATCGAA AGATGATTTG A

Protein sequence

MASHASRRYG LSRRDVIKTA VGAAATVGPF FHVAPARAAK TLKILQWSHF VPGYDKWFNN 
TYIKEWGAQH GTEVVVDNIN LGLIPSRAAA EVSAQKGHDL VMFLAPPSVY EEQVVDMKDV 
YDACEKKYGK PIDLAVKSTY NPKTRKYFAF SDSFVPDPVN YRSDLWGDVG MKPDSWDNVR 
IGGKKIKDKT GIPVGIGLSA ELDTAMAMRA IMYSFGAHEQ DVDGNLAINS KETLEALKFV 
KALFEETETP EVFAWDPSSN NRQMLAGRSS LVLNAISVTR TGENDKMPIH EKIALAKPPK 
GSVRQIGLEH VMDCYVIWKF SENIDGAKMF LVDYIDNFKQ GFMASEYYNF PCFSKTVPDL 
AQIISRDSKA VPPDKYAVLS DVLDWATNVG YPGYSNAAID ETFNTWAINT MFAEAAAGAE 
TPENALKRAE AKMKAIWAKW KDRKMI