Gene Clim_1669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1669
Symbol
ID	6353976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1835038
End bp	1836720
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	55%
IMG OID	642669274
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_001943690
Protein GI	189347161
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACCT TTTCGGACAA TATCTTCTGC CCTGAGCACC GCATGTACGG CAACGCTTCG 
AAAAAAACCC ACACAAAGGG ATGCATCCAC CCCATAGAAG TCGGCATGAG AACCCTCAGC 
CTCACGAAAA CCTACACCTG CAGGGGAATC GAATTTTCAT CGATCCCGCT CTACGACACA 
AGCGGACCCT ATTCCGACCC ATCCGTAATA ATAAATCCTG AAAAAGGACT GAATCCGCTT 
CGCGACAAGT GGAAGTTCAA CAGCGAAAAC ACGGAACCTG TTTCTGAACA AGGCAATGAA 
ACTGCAGCTG CCAGAGTGCC GCTTCGGGCA AAAAAAGGGT GCTCCGTCAC GCAGCTCGCC 
TTTGCGCGCA AGGGAATCAT CACTCCCGAA ATGGAGTATG TGGCTATTCG CGAAAACCAG 
CAGCTCGAAG AATGGATCGC ATCATTCCCG ATCGGCGGAA AAACCGCAGA ACCCTTCACC 
GCAGAATTCG TACGGCAGGA AGTTGCGGCC GGCAGGGCCA TCATTCCTGC CAACATTAAC 
CACCCCGAAC TTGAGCCGAT GATTATCGGA AGAAATTTCA GGGTAAAGAT CAATGCGAAC 
ATCGGCAACT CCGCCATGGG GTCCTCTATC GAAGAAGAGG TCGAAAAAGC CGTATGGGCA 
TGCCGCTGGG GCGCCGATAC CGTGATGGAC CTCAGTACAG GAACCAACAT CCACCAGACC 
AGGGAGTGGA TACTGCGTAA CTCACCCGTT CCTATCGGCA CGGTTCCAAT GTACCAGGCG 
CTTGAAAAAG CCGGAGGCGT TGCAGAAAAC CTCACCTGGG AACTCTACCG CGATACGCTC 
GTCGAACAGG CGGAACAGGG AGTCGATTAC TTCACCATCC ATGCCGGTAT TCTGCAGGAG 
CATTTGCCGG CCGCGGGCCG GCGCATGACC GGTATCGTGT CGCGAGGAGG TGCAATCATG 
GCCAAATGGT GCAAAACCAA TAACCGGGAA AATTTCCTGT ACACCCATTT CGACGAGATC 
TGCGAAATCT TGAGAAGCTA CGACATCGCC ATTTCGCTCG GCGACGCTTT GCGACCCGGC 
TGTATTGCAG ACGCAAACGA CGAGGCTCAG TTCGGTGAAC TGAAAGTGCT CGGCGAACTG 
ACCCTCCTGG CATGGGAGCA CGACGTGCAG GTAATGATCG AGGGACCGGG CCATGTACCT 
CTCAATCTCG TGGAAGAGAA CATGCGGAAA CAGCTCGAAC TTTGCCACGG AGCCCCGTTC 
TACACGCTCG GTCCGCTTAT TACCGATATT GCTGCCGGTT ACGACCACAT CAATTCTGCT 
ATCGGCGGCA CACTGATTGC CGCATACGGC TGTTCCATGC TCTGCTATGT CACCCCGAAA 
GAGCATCTCG GCCTGCCAGA CAAGAACGAC GTGAGAGAAG GCGTTGTGGT ACACAAAGTA 
GCCGCACACG CTGCCGATAT TGCGAAAGGA AACCCGACCG CATGGCTGCA GGACGAACTG 
ATGAGTCGCG CCCGATACGC ATTTGCCTGG GAGGATCAGT TCAATCTTTC GCTCGATCCC 
GTAAAAGCCA GGGTGCTGTA CGCCGAAAGC AGGGCCGCAA GCGGACAGAC CGACGGGAAT 
CCGGACTTCT GTACCATGTG CGGCCCGGAT TTCTGCTCCA TGAAACGCTC GCAGGAAAAG 
TGA

Protein sequence

MNTFSDNIFC PEHRMYGNAS KKTHTKGCIH PIEVGMRTLS LTKTYTCRGI EFSSIPLYDT 
SGPYSDPSVI INPEKGLNPL RDKWKFNSEN TEPVSEQGNE TAAARVPLRA KKGCSVTQLA 
FARKGIITPE MEYVAIRENQ QLEEWIASFP IGGKTAEPFT AEFVRQEVAA GRAIIPANIN 
HPELEPMIIG RNFRVKINAN IGNSAMGSSI EEEVEKAVWA CRWGADTVMD LSTGTNIHQT 
REWILRNSPV PIGTVPMYQA LEKAGGVAEN LTWELYRDTL VEQAEQGVDY FTIHAGILQE 
HLPAAGRRMT GIVSRGGAIM AKWCKTNNRE NFLYTHFDEI CEILRSYDIA ISLGDALRPG 
CIADANDEAQ FGELKVLGEL TLLAWEHDVQ VMIEGPGHVP LNLVEENMRK QLELCHGAPF 
YTLGPLITDI AAGYDHINSA IGGTLIAAYG CSMLCYVTPK EHLGLPDKND VREGVVVHKV 
AAHAADIAKG NPTAWLQDEL MSRARYAFAW EDQFNLSLDP VKARVLYAES RAASGQTDGN 
PDFCTMCGPD FCSMKRSQEK