Gene HMPREF0424_1064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HMPREF0424_1064
Symbol
ID	8709615
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gardnerella vaginalis 409-05
Kingdom	Bacteria
Replicon accession	NC_013721
Strand	-
Start bp	1214195
End bp	1215637
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	41%
IMG OID	646483156
Product	extracellular solute-binding protein
Protein accession	YP_003374267
Protein GI	283783513
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.075314
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAATC TTATGTCTGC ATTTGCAAGA ATTTTGCAAC AACGCAATCA TTTTTCGCGC 
TTGCTTCTGT CGATGCTTTG TGTTTTTTCT TTGCTATTTT CTTGCGGATG CGGAACTAAA 
GATTCTAGAA CTCAAATTAG TGTTTGGTCT TGGGAACCAA GCATGAAGCG ACTTGCTGAA 
GAATTTGAAC TACATAATCC GGATGTTCAT GTAACTGTAA AGGATACTAG CGGATATAGC 
AATCTTAATA GCGCTATTCA AGATGGCTAT GGTATGCCAG ATGTTGTTCA ATTAGAATAT 
TTTGCTCTTC CGCAATATGC GGTAAGTGGA CAGCTTTTAG ATATTACTGA TCGTGTGAAA 
AATACTCGCA CTTTCTATAC TCCTGGAACA TGGTCTTCTG TGCAACTTGG TGGACGTGTT 
TACGGTTTAC CAATGGATTC TGGCCCAATG GCTTGGTTTT ATAATGATGA CGTGTTTAAG 
CAGGCTGGTG TAGATGCCAC AAAAATACAC ACTTGGGAAG ATTACCGTCA TGCTGCTCGT 
AAGCTTAAAG ATATCGGTGT GTATATTGCA GCAGACTCAG GTGACGCAAG TTTTTATAAC 
GCTATGATTT GGCTTGCAGG TGGACACCCG TTTATGACTT CTCATGATGG GAAAACAGTT 
ACTGTTAGAT TGAGTAAAGA TAAGGGTACT GAAGAGTTCA CAAAGTTCTG GCAATCAATG 
ATTGATGAAG GATTGATTGA CATTAGAACT AGAACTTGGA GTCAACGTTG GAAGAACGGT 
GTTGGAGCTG GCAAGATTGC TTCTGTTTTC TCAGGAGCCT GGATGCCGTC TTTGCTGCTG 
GAAAATGTGC CTGGAACTGC AGGATTATGG AAGGTAACGA ATGTGCCAAC TATGCACGGA 
GAAAAGCGTA ATGCAGAAAT GGGCGGTTCT TCGTTATCTG TGCTTAAATC GAGTCGTAAG 
CCTGAAGCAG CAATGCGATT TGTGAATTTT GTATGCCATG ATATGCATGG AATTCGTACT 
CGTGTCAATG GTGGAGCGTT TCCTGCAGAT GTTGTTACGC TTAGAGATAA GTCATTTTTA 
GATAGAGCTA CTATTCGTGA TTCACGAGGT ATTGATATAC CCTATTTTGG CGGCCAGAAG 
TTTAATCGTG TATTTGCAGA TGCCGCTAAT CGCGTGGATA CGGGATACAG GTATTTGCCT 
TTTGAAGTGT ATTCGCGAAG TGATTTTAGA GCAACTATGG GTCAAGCATA TGACTGGAGT 
GTTAAATCTT TAGCTAGATT AAACGTGCAA GCCATGATTG ATGCTGGTGT TACTCAAGAT 
GATGGAAGTA AATTGTGGCT TCCAGATGAT CCTGGTAAGC GAATTTCTTT AAAAGATGGT 
CTTTTATTGT GGGAAAAAGA TCTTCAAGAA TATGGTTACA ATCAAGGATT TGTAGTTAGA 
TAA

Protein sequence

MANLMSAFAR ILQQRNHFSR LLLSMLCVFS LLFSCGCGTK DSRTQISVWS WEPSMKRLAE 
EFELHNPDVH VTVKDTSGYS NLNSAIQDGY GMPDVVQLEY FALPQYAVSG QLLDITDRVK 
NTRTFYTPGT WSSVQLGGRV YGLPMDSGPM AWFYNDDVFK QAGVDATKIH TWEDYRHAAR 
KLKDIGVYIA ADSGDASFYN AMIWLAGGHP FMTSHDGKTV TVRLSKDKGT EEFTKFWQSM 
IDEGLIDIRT RTWSQRWKNG VGAGKIASVF SGAWMPSLLL ENVPGTAGLW KVTNVPTMHG 
EKRNAEMGGS SLSVLKSSRK PEAAMRFVNF VCHDMHGIRT RVNGGAFPAD VVTLRDKSFL 
DRATIRDSRG IDIPYFGGQK FNRVFADAAN RVDTGYRYLP FEVYSRSDFR ATMGQAYDWS 
VKSLARLNVQ AMIDAGVTQD DGSKLWLPDD PGKRISLKDG LLLWEKDLQE YGYNQGFVVR