Gene HMPREF0424_0153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HMPREF0424_0153
Symbol
ID	8708928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gardnerella vaginalis 409-05
Kingdom	Bacteria
Replicon accession	NC_013721
Strand	+
Start bp	174289
End bp	175338
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	48%
IMG OID	646482272
Product	thiamine biosynthesis lipoprotein, ApbE family
Protein accession	YP_003373417
Protein GI	283782663
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.191913
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGGGA ATGTAATGGC GATTGAGCGC GCGCTTGGCA CGGGGATTAT TATCTCTAGC 
AGCGTGCCGA TTTCGCAGCG CGTGCAGAAT CGGATTCGCG ATTTTATTGA AGAGTATGAA 
TCGGTGCTTT CGCGCTTTCG TGCGGATTCG CTTGTTTCGC GCATGGCTTG TGCGGAGCAT 
GGCGGCGAGT TTGAGTTTCC AACGTGGGCT CAGCCGCTTT TTGCGATCTA TAGCGAGTTT 
TACGATGCCA CGCACGGTGC TTTTGACGCT TGTATTGGTG CGGATCTGCT TGCGCTTGGC 
TACAACAATT CTGTGCAATT CGTTCCGGAG TCGGCAGCTA GCGCAGGCAA GAACGATAAT 
AGCAGCAGCT ACAGTTGCTC TAACTATCGC CGCGCTCTGC CAGTTAAGTG GGCAGATATT 
TCGCGAGATG ACGGCGGCGC AACGCTTCAC ACAAATAAGC CAGTGCAGCT TGATTTTGGT 
GCAGCCGGTA AGGGCTATTT TGTAGATCTT GTAATGCAGA TTATTAAAGA GGAGTTTAGT 
GACGATTCGA CTGCGAATAA TTATTTTCCT TCGGATTTTG ATTTTTTGGT AAACGCAGGC 
GGAGATATGC GCGCTTGCTT TAGCAAAAAG AATAGTCAAA TAAAAGTTGC GCTAGAAAAT 
CCTTTTGACA CAACGCAAGC GGTAGGTGTG GCATCAATCG CAAGCGGAGC GTTGTGTGCT 
TCGTCTGCTG CAAGAAGGCG CTGGAAAGTA AAAGACACAA ATTGCCTTGC AGCTGATGCT 
TTTGAATCTA ATGTAGTTGC AACTCACCTT ATCAACGCTT TAGATGGCGT ACCTTCGCAA 
AAACTTTCTG CAAGCTGGAC TTACGTTCCT GCTAAAACAT GTGCTTTTCC GACTGCTTAC 
GCCGATGCGC TCGCAACTGC GCTTTTTATT TCGCAAGAAA GCGATTTGCA AAAAATCGCG 
CAAACTACCG GCGCTGAGTT TGCTGTAATG CAGCCAAATC ATGCGCTTCG CAAAACGTGT 
GCTTTCCCAG CGCGCTTTTT TGCTGAATAA

Protein sequence

MFGNVMAIER ALGTGIIISS SVPISQRVQN RIRDFIEEYE SVLSRFRADS LVSRMACAEH 
GGEFEFPTWA QPLFAIYSEF YDATHGAFDA CIGADLLALG YNNSVQFVPE SAASAGKNDN 
SSSYSCSNYR RALPVKWADI SRDDGGATLH TNKPVQLDFG AAGKGYFVDL VMQIIKEEFS 
DDSTANNYFP SDFDFLVNAG GDMRACFSKK NSQIKVALEN PFDTTQAVGV ASIASGALCA 
SSAARRRWKV KDTNCLAADA FESNVVATHL INALDGVPSQ KLSASWTYVP AKTCAFPTAY 
ADALATALFI SQESDLQKIA QTTGAEFAVM QPNHALRKTC AFPARFFAE