Gene Cthe_1404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1404
Symbol
ID	4809065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	1720661
End bp	1722811
Gene Length	2151 bp
Protein Length	716 aa
Translation table	11
GC content	43%
IMG OID	640106827
Product	GTP-binding protein, HSR1-related
Protein accession	YP_001037828
Protein GI	125973918
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0370] Fe2+ transport system protein B
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR00437] ferrous iron transporter FeoB

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000264351
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGCTTA CGAGTCAATC CACAGGAGCA GGTGTTCTGG AAAACAAACT TACCATTGTA 
AAAAGCACGC CTGTTGACAA AGTCATAGCA CTTGCCGGAA ACCCCAACGT TGGTAAAAGC 
ACGGTATTCA ACAGTCTTAC GGGATTGAAC CAACACACGG GAAACTGGCC GGGCAAGACT 
GTCACCAACG CCCAGGGAAG ATACAAACAT AAAGATAAAA ACTTTATCAT GGTTGATATA 
CCGGGTACAT ATTCTCTCAT GGCCAACTCA GTGGAAGAAG AAGTGGCAAG GGATTTTGTA 
TGCTTTGGCC AGCCTGACGC CACCGTTGTT GTAACTGACG CCACATGCCT TGAGAGAAAT 
TTGAACCTGG TGCTCCAAAC CCTTGAAATC ACAAACAAAG TTGTCGTTTG CGTTAACTTA 
ATCGATGAAG CAGAAAGAAA AAAAATAAAA ATTGACTACA ACAAACTTTC AAAGCATCTG 
GGGGTTCCTG TCATTCCTAC AAATGCCAGA AGCAACAAAG GACTTGACAA ACTAATGGAT 
GCAGTTTATG AAATTTCAAC CAAAGAAACA ACATCCCATC CTATAAAAAT TACCTATGAT 
GACATTGTGG AAGAGGCAAT TAAAATGATT CAGCCAAAAA TTGAAACGAT AGCCGGAGAA 
AAAATTAACA GCCGTTGGGT GGCACTTAAG CTTTTGGACA ATGACGGTGC TTTGCTGGAG 
TCATTGAACA ATTTCCTCGG TTTTAATCTT CTGGATGATA ACGAACTTGC AGAACTTGTA 
GACATGGCAA AAAAACACCT TTTGAATAAC GGTATCGGGC AAAATCAGCT TAGAGATAAA 
ATTGTTACAC GGCTGGTGAA AATTGCAGAA GAAATCTGCC AAAGCGTAAT TACCTTTGAG 
AACAAACAAT ACGACCATTT AGACAGGAAA ATAGACAAAA TCCTGACATC AAGGGTTTTC 
GGAATACCCG TCATGCTTGC CATGCTTGGG GTAATTTTCT GGATTACAAT CACAGGAGCA 
AACTATCCTT CACAAATGCT TTCAACTTTA TTTTTCTGGA TAGAGGAAAG ACTAACCGAC 
TTTTTTGTAT GGGCAAAAGC TCCCAAATGG CTTCATGGAT TGTTGGTGAC GGGAGCCTAC 
AGAACTTTGG CATGGGTTGT ATCGGTTATG TTGCCTCCGA TGGCCATATT CTTCCCATTG 
TTTACTCTGC TCGAAGACCT GGGGTATCTT CCCAGAGTTG CTTTTAACCT TGACAATTTC 
TTTAAGAAAG CTTGCGCTCA CGGCAAACAA TCTCTGACCA TGTGCATGGG TTTTGGCTGC 
AATGCCGCCG GAGTCATTGG ATGCCGAATA ATCGACTCAC CGCGCGAAAG GCTGATAGCC 
ACAATTACCA ACAATTTTGT ACCCTGCAAC GGTCGTTTCC CAACTCTGAT TGCAATAATA 
ACCATGTTCT TTGTGGGAAA TTTTGCAGGT TTTTCTCAAT CGGTGCTTTC AACGCTCTTT 
TTGACCGGAG TAATCCTTTT GGGTATTGTG ATGACGTTGC TTGTTTCAAA ACTTCTGTCC 
AAAACAATAT TAAAAGGACT TCCTTCTTCC TTCGCCCTGG AACTTCCGCC GTACCGGAAG 
CCCCAAATAG GCAGAATTAT CGTAAGGTCC ATATTTGACA GAACTTTGTT CGTGCTTGGC 
AGGGCTGTTT CAGTAGCCAT TCCCGCAGGG TTTGTAATAT GGATTATGGC AAACATTTAT 
GTTGGAGAAC AAAGCCTGTT ATCCCTTTGC GCAGGTTTCC TCGATCCCTT TGCCAGATTA 
ATCGGACTGG ACGGCTACAT CCTAATGGCT TTCATTCTCG GTTTTCCTGC CAATGAAATC 
GTGGTTCCGA TAATTATAAT GAGCTATATG TCATCTGAAA GCATGATGGA ACTTGAAAAC 
TTAAACCAGC TAAAACAGCT GCTTGTGGAC AACGGCTGGA CTTGGGTCAC GGCACTGTGT 
GTCATGCTGT TCTCCCTGAT GCACTGGCCT TGCAGCACCA CCTGTCTGAC CATTAGAAAA 
GAAACACAGA GCTGGAAATG GACTTTAGTA TCATTTTTAG TTCCAACTCT GTCAGGTATT 
GTAATTTGTT TTATAGTTGC GAATTTGGCA AGACTTCTCG CACTGGTTTA G

Protein sequence

MGLTSQSTGA GVLENKLTIV KSTPVDKVIA LAGNPNVGKS TVFNSLTGLN QHTGNWPGKT 
VTNAQGRYKH KDKNFIMVDI PGTYSLMANS VEEEVARDFV CFGQPDATVV VTDATCLERN 
LNLVLQTLEI TNKVVVCVNL IDEAERKKIK IDYNKLSKHL GVPVIPTNAR SNKGLDKLMD 
AVYEISTKET TSHPIKITYD DIVEEAIKMI QPKIETIAGE KINSRWVALK LLDNDGALLE 
SLNNFLGFNL LDDNELAELV DMAKKHLLNN GIGQNQLRDK IVTRLVKIAE EICQSVITFE 
NKQYDHLDRK IDKILTSRVF GIPVMLAMLG VIFWITITGA NYPSQMLSTL FFWIEERLTD 
FFVWAKAPKW LHGLLVTGAY RTLAWVVSVM LPPMAIFFPL FTLLEDLGYL PRVAFNLDNF 
FKKACAHGKQ SLTMCMGFGC NAAGVIGCRI IDSPRERLIA TITNNFVPCN GRFPTLIAII 
TMFFVGNFAG FSQSVLSTLF LTGVILLGIV MTLLVSKLLS KTILKGLPSS FALELPPYRK 
PQIGRIIVRS IFDRTLFVLG RAVSVAIPAG FVIWIMANIY VGEQSLLSLC AGFLDPFARL 
IGLDGYILMA FILGFPANEI VVPIIIMSYM SSESMMELEN LNQLKQLLVD NGWTWVTALC 
VMLFSLMHWP CSTTCLTIRK ETQSWKWTLV SFLVPTLSGI VICFIVANLA RLLALV