Gene Tcr_2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tcr_2041
Symbol
ID	3761958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiomicrospira crunogena XCL-2
Kingdom	Bacteria
Replicon accession	NC_007520
Strand	-
Start bp	2253746
End bp	2254912
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	46%
IMG OID	637786790
Product	hydrogenase expression/formation protein HypD
Protein accession	YP_392305
Protein GI	78486380
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0409] Hydrogenase maturation factor
TIGRFAM ID	[TIGR00075] hydrogenase expression/formation protein HypD

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACGC TTCAGTTACA AGATTTGTAT CAAGGGTTTC GACAGCCCAA AACCATTCAG 
GCATTGGCAC AGAAAATTCA TCAAACGGCT CAGACGCTGA GTTCGCCACT TCGGATTATG 
GAAGTCTGCG GTGGGCATAC GCACACCATT ATGAAGTATG GTTTGAACCA GCAGCTACCA 
GAAAACATTG AGTTCATTCA TGGTCCAGGG TGCCCGGTAT GTATTATGCC GAAAGAGCGG 
ATTGATCATG CCATTGCGCT GGCGCAAATG CCGAATACGA TTTTGCTGAC ATTAGGCGAT 
ATGATTCGTG TGCCTGGCTC GAAAACCAGT TTGGCGAAGC AGCGTGCTTT AGGCAGTGAC 
ATTAGAGCCC TGTATTCGCC GTTGGATGCG TTGACAATTG CGCAGGAAAA TCCTGACAAA 
CAGGTGGTGT TTTTTGCCAT TGGATTTGAA ACCACTACGC CAATGACAAC GGCGGTGATT 
CAGCAAGCAT TGGTATTAAA GTTACCCAAT CTTTTTTTTC ACATCAACCA TGTGTTGGTA 
CCGCCTGCCG TGGCCGCAAT CTTGTCGGAT AAAGACTGCC AGATCAATGC ATTGATTGGT 
CCTTCCCATG TCAGTGTAAT CAGTGGTGCA CAAATTTATC AGCCACTGGC GGCACAACAC 
CGTATACCGA TTGTGGTCAG TGGGTTTGAG CCAGTGGATG TGATGCAAAG TATTCTGATG 
ATTGTAGAGC AAATGCTTCA AAAAAGGCAT CAAGTCGAGA TTCAATATTC ACGTGCGGTA 
ACAGAACAAG GCAATCAAAA AGCTCAGCAG ATGATTGAAA CCTATCTGGA ACCTCGTTCC 
CATTTCCGTT GGCGTGGCTT GGGCGACATT CCGCTCAGTG CTTTGCAATT AAAAGACGCT 
TATCGTTTTT TGGATGCCGA AACGGTTTTT AAATCGGTTT TGTCGGATGA ACCGATTGAC 
GATCATAAAT TGTGTATTTG CGGTGATATT CTTAAAGGTG TCGCCAAACC ACAAGACTGT 
AAGGTGTTTG GTCGAGGCTG CGACCCGGCA CGACCACTGG GCAGTTGCAT GGTATCAAGT 
GAAGGTGCTT GTAATGCGTA TTATCGATAT GCTGAAGTGG CCTTGCCCAA AGGAAAAACG 
TTTGAGAAAA AACGAGCAAC CGCATGA

Protein sequence

MTTLQLQDLY QGFRQPKTIQ ALAQKIHQTA QTLSSPLRIM EVCGGHTHTI MKYGLNQQLP 
ENIEFIHGPG CPVCIMPKER IDHAIALAQM PNTILLTLGD MIRVPGSKTS LAKQRALGSD 
IRALYSPLDA LTIAQENPDK QVVFFAIGFE TTTPMTTAVI QQALVLKLPN LFFHINHVLV 
PPAVAAILSD KDCQINALIG PSHVSVISGA QIYQPLAAQH RIPIVVSGFE PVDVMQSILM 
IVEQMLQKRH QVEIQYSRAV TEQGNQKAQQ MIETYLEPRS HFRWRGLGDI PLSALQLKDA 
YRFLDAETVF KSVLSDEPID DHKLCICGDI LKGVAKPQDC KVFGRGCDPA RPLGSCMVSS 
EGACNAYYRY AEVALPKGKT FEKKRATA