Gene HMPREF0424_0191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HMPREF0424_0191
Symbol
ID	8709898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gardnerella vaginalis 409-05
Kingdom	Bacteria
Replicon accession	NC_013721
Strand	+
Start bp	212445
End bp	213932
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	41%
IMG OID	646482310
Product	extracellular solute-binding protein
Protein accession	YP_003373455
Protein GI	283782701
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTGTGT CTGTAATAAT GAGCGGCATT TTGTGGTGTG GATGGCAAAT GTACCAGGGT 
CATTCGCCTT TTGCTGCAAT AATGCATCCA GCTAGTAACT CAGTGCTAAA AGTTGGTCTA 
CGTACTGCTC CTGAATCTCT TGATATTAGA AACGACGACA GTGACGCTTT ACAGCAAGCT 
TTAATTGGTA ATGTTTACGA AACTCTTGTT AAACGTGGCG ATGATAATAG TTTGCAACCA 
GGTCTCGCGA AGTCATGGGA TATTTCGAAA GACGGCTTAA CATATCGTTT TAATTTGCGT 
CAAGGTGTGC ATTTCTCTAA CGGTAGTGAG ATGACTTCAA ATTCCGTATT ACAATCTTTG 
AAACAAGGCA TCACAAATAA TTATCCTGGT TATAGTGCAC TTACAAATAT TAAAACTGTT 
AATAATCCGG ATGATTACAC TTTAGTAATT ACACTTAATA ATCCAGATGC TTTACTTCTA 
CGTCGTCTTG CTGGACGTGT TGGCATTGTC TATGACACAA AATCGATGAT CGACTATGCA 
AGTGCTGCTC TTGGCACAGG TCCTTTCACT GTAAGTGACT ACAATAAAGG CAATTCTTTA 
GTATTACTTC GCAACGATAA ATATTGGGGA ACCCCTGCTT CTTGTGCAAG TATTACTTTG 
CAATATTTCA ATAGCGATAC TGCTCTAGCT GAGGCAATGG AAAAGGGCAA TATTCAAATG 
GCAGTTCCGC TTGAAGGTAA CGAAAATAAG CGCCTTGCTG CTGTTGCTAA TACGCAAATG 
GTAGAGGGTC AGAGCACAAG AGTGCGATTT ATTGCAATAA ATACAACAGT TTCGTCGATT 
TTCTGCGATG AGCAGGCTCG TAAAGCTGCG AGATACGCTT TGAATGCGCA AACTGTACTT 
GCAGCTGATG GCAATGGTGG TGTTCCAGTA GGAGGACCTA TTGATCCTCT TTCAACTGGT 
TATGAAGATT TAAATGGATT GTATCCTTAT AATCCAGGCA AAGCTGCTCC TTTGTTCCAT 
TACTTTAGCG CAAGCTATTT AGGAACTATT AATTTTCTTG TTCCACAGGG CGAAGGTGGA 
GTTGGGGGCG AGCTTTCAAA ACAGATTAGT TCCGTGAGCG GTTTTAAGGT CAATCTTGAA 
GAAGTTGATC AACAAACTAT GCGTAAGCGT ATTAGTGAAG GTAAGTATGA TCTTGCGCTT 
ACTACGAGCA ATCGTACTTT AGATGAAGGC ATGTTTGCAG AAAGCGGTTC TCCGTTCGTT 
TTGCAAGACG CGCGTGCTCA ACAAGCTTGG ACCGATGCGG TTCATTCTAA GAATGCAAAC 
GAATATGAGA CAAATGCTCG TGCATATGCG CGCGAAGTAA GCAATAATGC TGCAGCTCAC 
TGGTTATATG CTCGAAAGAG CATTATGGCT GTAAAGTCTA ATGTAAGCGG CTATACGAAA 
AATATGACGG ATCAGCTTCT GCCATTGCAG AGCATAGTGG TGAAATAG

Protein sequence

MVVSVIMSGI LWCGWQMYQG HSPFAAIMHP ASNSVLKVGL RTAPESLDIR NDDSDALQQA 
LIGNVYETLV KRGDDNSLQP GLAKSWDISK DGLTYRFNLR QGVHFSNGSE MTSNSVLQSL 
KQGITNNYPG YSALTNIKTV NNPDDYTLVI TLNNPDALLL RRLAGRVGIV YDTKSMIDYA 
SAALGTGPFT VSDYNKGNSL VLLRNDKYWG TPASCASITL QYFNSDTALA EAMEKGNIQM 
AVPLEGNENK RLAAVANTQM VEGQSTRVRF IAINTTVSSI FCDEQARKAA RYALNAQTVL 
AADGNGGVPV GGPIDPLSTG YEDLNGLYPY NPGKAAPLFH YFSASYLGTI NFLVPQGEGG 
VGGELSKQIS SVSGFKVNLE EVDQQTMRKR ISEGKYDLAL TTSNRTLDEG MFAESGSPFV 
LQDARAQQAW TDAVHSKNAN EYETNARAYA REVSNNAAAH WLYARKSIMA VKSNVSGYTK 
NMTDQLLPLQ SIVVK