Gene VC0395_A0417 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0417
Symbol	thiI
ID	5135323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	+
Start bp	443586
End bp	445133
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	48%
IMG OID	640531875
Product	thiamine biosynthesis protein ThiI
Protein accession	YP_001216372
Protein GI	147673207
COG category	[H] Coenzyme transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase [COG0607] Rhodanese-related sulfurtransferase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000000383743
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCGTGT ATAATCGCGC CCCTTTAGCG GTAAGCGCCT TGCCAAGGTT TACCTGCTGC 
TCGCCAGATT GTCTAACTCA GATTGCGAAT AACTGTATGA AATTTATCGT TAAACCCCAT 
CCGGAAATTT TTGTGAAAAG TGAATCGGTA CGTAAGCGTT TCACAAAGAT CCTTGAGAGC 
AATATTCGAA TTATTGTGAA AGCCCGCACA CAAGGGGTGG CGGTATTCAA TCGTCGTGAT 
CATATTGAAG TGACGTCAAA CAGCGATACT TATTACGCCG AAGTGTTGGA GATTCTGACG 
ACCACACCGG GTATCCAGCA AGTGTTGGAA GTGCAGCAAT CAAGCTTTAC CGATCTGCAC 
AACATCTACG AGCAAGTGCT GGAGCTAAAT CGCGCTAACC TCGAAAACAA AACCTTTGTT 
GTGCGCGCGA AACGCCGTGG TAAGCATGAT TTTACCTCTA TTGAACTCGA ACGTTATGTT 
GGGGGTGGCC TCAATCAAGC CATCGCCAGT GCCAAGGTAA AATTGATTAA CCCTGACGTG 
ACCGTGCAAG TGGAAGTGGT CGATGAGCTG CTTAACCAAG TGATCGCGCG TCATAAAGGT 
TTAGGTGGTT TCCCTCTGGG GACCCAAGAA GATGTATTGA GCCTGATTTC TGGTGGCTTC 
GACTCCGGTG TGTCGAGCTA TCTGCACATT AAACGTGGTT CAAAAGTGCA TTACTGCTTC 
TTTAATCTGG GGGGACCCGC CCACGAAATT GGTGTGAAGC AAACCGCTTA CTACCTGTGG 
CAAAAATACG GTTCATCGGC CAAAGTGCGA TTTATCGCGA TCGATTTTGC TCCTGTGGTG 
GCTGAGATCC TCGAGAAGAT CGATGATGGT CAAATGGGCG TGGTGCTCAA GCGTATGTTT 
ATGCGCACCG CCGGTATGGT GGCTGAGAAG TTTGGCATTC AAGCTTTGGT TACGGGTGAA 
GCGCTAGGCC AGGTTTCTAG CCAAACCCTG ACTAACCTGC GCCATATCGA TAACGTGACC 
GATACTTTGA TTCTGCGTCC GCTCATCAAC TGGGATAAAG AAGACATCAT CCGTCTGGCG 
CGTGAAATTG GTACGGAAGA TTTCGCCAAA ACCATGCCTG AATTCTGCGG GGTGATTTCA 
AAAAGCCCAA CCGTAAAAGC GGTAAAAGAG AAATTGGAAG AAGAAGAAGC CAAATTCGAT 
TTTGCTCTGC TTGATCAAGT GGTGTACAAC GCGCGCCAAA TCGACATTCG TGATATTGGT 
AAAGAGTCGC TGGAAAAAGC CCCTGAAGTG GAGTTGGTTA ACAGCGCAGA AGAGGGTAAC 
GCCGTCGTAC TGGATATTCG TAGCCCAGAC GAAGAGGACG AAAGCCCGCT AGAGATTGCG 
GGTGTGGAAG TGAAGCATCT GCCTTTCTAT AAGCTTGCGA CTCAATTTTG TGACCTCGAT 
CAGTCAAAAA CCTACTTGCT GTACTGCTCA CGTGGCGTGA TGAGCCGCTT ACAAGCGCTG 
TACCTGCAAG AACAAGGGTT TAACAATGTG AAAGTTTATC GTCCATAG

Protein sequence

MIVYNRAPLA VSALPRFTCC SPDCLTQIAN NCMKFIVKPH PEIFVKSESV RKRFTKILES 
NIRIIVKART QGVAVFNRRD HIEVTSNSDT YYAEVLEILT TTPGIQQVLE VQQSSFTDLH 
NIYEQVLELN RANLENKTFV VRAKRRGKHD FTSIELERYV GGGLNQAIAS AKVKLINPDV 
TVQVEVVDEL LNQVIARHKG LGGFPLGTQE DVLSLISGGF DSGVSSYLHI KRGSKVHYCF 
FNLGGPAHEI GVKQTAYYLW QKYGSSAKVR FIAIDFAPVV AEILEKIDDG QMGVVLKRMF 
MRTAGMVAEK FGIQALVTGE ALGQVSSQTL TNLRHIDNVT DTLILRPLIN WDKEDIIRLA 
REIGTEDFAK TMPEFCGVIS KSPTVKAVKE KLEEEEAKFD FALLDQVVYN ARQIDIRDIG 
KESLEKAPEV ELVNSAEEGN AVVLDIRSPD EEDESPLEIA GVEVKHLPFY KLATQFCDLD 
QSKTYLLYCS RGVMSRLQAL YLQEQGFNNV KVYRP