Gene VC0395_A2452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A2452
Symbol	thiC
ID	5136006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	2607353
End bp	2609290
Gene Length	1938 bp
Protein Length	645 aa
Translation table	11
GC content	48%
IMG OID	640533904
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_001218352
Protein GI	147675426
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGAACC GTAAACAAGC AAGACTGGAA GCCAAGCGCT TTATTGATAC CCTTTCTGTT 
GAACCCTATC CTAACTCTCA AAAATCTTAC CTATTAGGCT CTCGCCCTGA TATTCGGGTG 
CCTGTCAGAG AAATTACTCT CAGCGATACT TTGGTCGGTG GCAGTAAAGA TGCACCCATC 
TTTGAGCCCA ATGAGCCTAT CTGTGTGTAT GACACATCTG GCGTCTATAC TGACCCTTCA 
CATGATATTG ATCTCTACAA GGGGCTTCCT AAGCTCAGAG AGGAGTGGAT TGAAGAGCGT 
CGAGATACGC ACATTCTGCC TAGTATGAGC TCTCATTTCG CCCGTGAACG CTTAGCGGAT 
GAAACTCTAG ATGAACTGCG TTATGGCCAT TTACCGCGAA TTCGCCGAGC GATGGGCCAG 
CATCGAGTCA CTCAGTTACA TTACGCACGG CAGGGAATCA TTACGCCGGA AATGGAGTTT 
GTGGCGATCC GTGAAAACTC TCGTCGTCTT GCTCATCAAG ATCCAAGTCT ACTTCAGCAG 
CATGCTGGGC AGAATTTTGG TGCTCATTTA CCCGATCTGA TTACTCCTGA GTTTGTGCGT 
CGTGAGATTG CAGAAGGGCG CGCCATCATC CCATGCAATA TTAATCATCC TGAATCTGAA 
CCCATGATTA TTGGCCGCAA TTTCTTGGTT AAGGTGAATG CCAATATCGG TAACTCTTCT 
GTTAGCTCTT CTATTGAAGA AGAAGTCGAG AAGTTAGTTT GGGCGACCCG CTGGGGCGCA 
GATACTGTGA TGGATCTGTC GACAGGGCGA AATATCCATG AAACCCGCGA GTGGATCTTA 
CGTAATAGCC CCGTGCCAAT TGGTACTGTA CCTATGTATC AGGCGCTGGA AAAAGTGAAT 
GGTGTAGCAG AAAACCTCAC ATGGGAAGTG ATGCGCGATA CCTTACTAGA GCAAGCTGAG 
CAAGGTGTGG ACTATTTTAC AATTCATGCG GGCTTGCTAT TGCGTTATGT GCCGATGACA 
GCCAAGCGCG TAACGGGCAT CGTTTCTCGT GGCGGCTCGA TTATTGCGAA ATGGTGTCTT 
TCTCACCATC AAGAGAATTT CCTTTATACC CATTTTCGCG AAATCTGTGA GATTTGTGCG 
CAATATGATG TGGCTCTATC TCTAGGGGAT GGACTTCGTC CTGGCTCGAT TGCTGATGCT 
AACGATGAAG CGCAATTTGC TGAGTTACGT ACCCTTGGTG AGCTAACCCA AATAGCTTGG 
GAATATGATG TGCAGGTCAT GATTGAAGGG CCGGGTCATG TACCTATGCA CTTAATTAAA 
GCCAATATGG ATGAGCAGCT TAAGCATTGT CATGAGGCGC CATTCTATAC CCTTGGTCCA 
TTAACTACCG ATATTGCCCC GGGTTATGAT CACATTACCT CCGGTATCGG TGCGGCCATG 
ATTGGTTGGT TTGGCTGCGC CATGCTCTGC TATGTCACAC CTAAAGAACA TTTGGGGCTG 
CCAAACAAAG AAGATGTCAA AACAGGATTG ATTACTTATA AGTTAGCGGC TCATGCAGCA 
GATTTGGCGA AAGGGCATCC GGGAGCGCAA ATTCGTGATA ATGCATTATC AAAAGCACGT 
TTTGAGTTTC GTTGGGAAGA CCAGTTCAAT CTTGCGCTTG ATCCCGTCAC AGCACGCGCT 
TTCCATGATG AGACCCTACC GCAGGAATCG GGCAAAGTCG CGCACTTTTG CTCTATGTGT 
GGCCCCAAAT TCTGCTCGAT GAAGATCTCG CAAGAGGTCA GGGATTACGC AAATAACCAG 
ACATTAGACA CCACCGTCAT TGACTTGGTT ATGCCTGCAG AATCTATACA GCTGGCGATG 
CAAGATAAGT CTCGTGAGTT TTTAGCCTCA GGTGCTGAAC TCTATCATCC TTTGGTGAAA 
GAGCCGATCG AGGAGTAA

Protein sequence

MSNRKQARLE AKRFIDTLSV EPYPNSQKSY LLGSRPDIRV PVREITLSDT LVGGSKDAPI 
FEPNEPICVY DTSGVYTDPS HDIDLYKGLP KLREEWIEER RDTHILPSMS SHFARERLAD 
ETLDELRYGH LPRIRRAMGQ HRVTQLHYAR QGIITPEMEF VAIRENSRRL AHQDPSLLQQ 
HAGQNFGAHL PDLITPEFVR REIAEGRAII PCNINHPESE PMIIGRNFLV KVNANIGNSS 
VSSSIEEEVE KLVWATRWGA DTVMDLSTGR NIHETREWIL RNSPVPIGTV PMYQALEKVN 
GVAENLTWEV MRDTLLEQAE QGVDYFTIHA GLLLRYVPMT AKRVTGIVSR GGSIIAKWCL 
SHHQENFLYT HFREICEICA QYDVALSLGD GLRPGSIADA NDEAQFAELR TLGELTQIAW 
EYDVQVMIEG PGHVPMHLIK ANMDEQLKHC HEAPFYTLGP LTTDIAPGYD HITSGIGAAM 
IGWFGCAMLC YVTPKEHLGL PNKEDVKTGL ITYKLAAHAA DLAKGHPGAQ IRDNALSKAR 
FEFRWEDQFN LALDPVTARA FHDETLPQES GKVAHFCSMC GPKFCSMKIS QEVRDYANNQ 
TLDTTVIDLV MPAESIQLAM QDKSREFLAS GAELYHPLVK EPIEE