Gene HMPREF0424_1000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HMPREF0424_1000
Symbol
ID	8709173
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gardnerella vaginalis 409-05
Kingdom	Bacteria
Replicon accession	NC_013721
Strand	+
Start bp	1132215
End bp	1134185
Gene Length	1971 bp
Protein Length	656 aa
Translation table	11
GC content	50%
IMG OID	646483093
Product	hypothetical protein
Protein accession	YP_003374208
Protein GI	283783454
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG3096] Uncharacterized protein involved in chromosome partitioning
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATT TTCAGAATGC TACGTGGAGC GTGATCCAAT TGGATTATGC GAACGCGTTT 
ATTCCTGACG TTCGTTTGAA CGGTGGCGAC GAGAATGGGC GTATTATCCG CGTGCAATTG 
TTAGATAATG GTGTGCCGGT TGATGATTCG ACTGTTGAAG TGTTCTTGTG CTGGAATCGC 
CAGCCGGGGG TGCTTATTGG TGACCGCGTA AAAATGGAAG CGAAGGATTC TGACGATGGT 
CGCATTTGGC AGGTGGCGGT GCCGGTTGCG GCTTGTCGTA TGCCGGGCAC AGTGACTCTT 
GGTTTTGAAG TGAAACGTGA TAAGACGATC GTTTGCTCGC GTAGTTTTAC TGCTATTGTC 
GAGCAGCCGG TTTTTGACGC TGGTTCGCCT GAGGGTAAGT CTTACAGGCA GGAGCTTGAA 
GACACGGCAC AACAAGCAAA GGACGCTACT GGTAAAGCTA ACGCTTTAAC TGATAAAGTT 
TCACACCTGA TTGAACAGAA TGAAACAGTA TCGCGGAATG CTCAAAATGC GGCTGATGCC 
GCTAATAATG CTACTAGCAT AGCGCAACAG GCGGCACAAC AAGCAAAGGA CGCGGCAAGT 
GAAGCATCAC AAGCTGCTCA AAACACTCAA AACGTTATTA GTCACGCTAC TGAAGTTGCC 
CAACAGTGTG ACGCTAGTAA ACAGACTGCT GACCAAGCAG CAAAGCGCGC TGATGATGCT 
GTGAGTGGGT TAAAGCAAAC TGTGCAGAAT GCTGCTGCTG ATGCGGCTAG TAAAGTGCAG 
CAGGCTGTTG AGCGCGCTAA CAGTGCGACT CAAGCCGTGG ACGCGGTTCG TGAGAAAACA 
GAAGCTGCAA ACAAACAAAC TGAAACCGAT CTAGCAGCAT TAAGAGAAGA GGTCGTTAAA 
GCTCAGCGCG CCGGCTTTAC CGCGTCATCT AGCGCGCAAA AATGCGATGA AGCAGCACAA 
GCTTATAGGA ACGTGTCCGG TGAGGTAGCT CAAGCTAAAC AGACTAGCGA ACAGGCGGTT 
GAAGCGGCTA ATCAGGCGTT GCATACGGCT CAGGAGTCTG CTGCTGCGGT GGCTCAAGCT 
CAGAGCGTTC TTGACCAAGT AAAGGATGCT AGCGAGACTG CTAAGCGTGT GGTGAGTGCT 
GTTGAAGAGT TGAAGCAGAC GAATAACGCG GCACTTGAAG CTACTCGTAC GGCTAACGCT 
CAAGCGTCTG CAGCCGCTGA TGCGGCTGGC AAGGCTAATA ATGCTACTAG CACAGCCAAC 
AGCGCAGCGC AAGCGGCGAA TGATGCGGCT GGCAAGGTTA CGCAGACTTT GCAAGAGTCT 
GAAACACGTT TTAAAGCTGT TGAACAGGCA GCGAATGATG CTAAAAGCGT GGCTGGTACG 
GCGAATAGTA CAGCTGAAGC GGCGCGCTCT ACAGCTGAGC AGGCTCAGAG CAAAGCTAAC 
GACGCGGCGG GATCAGCTCA ACGCGCTCAA AACACAGCTA ACAGTGCTAT TGAAGCTACT 
GATAACAATA AAAATCGCAT TGACTCTATG GAGTCGGATG TTAGCTCGTT AAAAAACTCT 
TGTAGCGCAG CACAGAGTAA GGCGAACGAT GCGGCTCAGA CTGCTAGTAA AGCACAGTCG 
GTAGCGGATA GTGCTAATAG TGCGGCGCAA GCAGCTGCTA GTAAAGCTGA TAGCGCACAA 
CAAGCAGTAA ACAACATTCG CACACCAATA GTAAAACCCC AATCATTGAC CGGTTACACA 
ACCCCAAGTT CTTGGGATTG GACTCTAACA GATTTAAAAG AATTACCACA TGGGGGGCAT 
ATTCTCATCT ACCCACAAGC TGACAGTATT AAAGAGTACA TGCGCCAGCA GCCAGAGTTC 
GAGATTGAAG AACAGAATGG TGTGCGAACA GGGAAAATAA CTGTAATAAC TCACCAGCCG 
AATACTAACG GTTCTGCTCT AAAGCTTGTT TTTGTTTGGT TTGCGGACTA G

Protein sequence

MSDFQNATWS VIQLDYANAF IPDVRLNGGD ENGRIIRVQL LDNGVPVDDS TVEVFLCWNR 
QPGVLIGDRV KMEAKDSDDG RIWQVAVPVA ACRMPGTVTL GFEVKRDKTI VCSRSFTAIV 
EQPVFDAGSP EGKSYRQELE DTAQQAKDAT GKANALTDKV SHLIEQNETV SRNAQNAADA 
ANNATSIAQQ AAQQAKDAAS EASQAAQNTQ NVISHATEVA QQCDASKQTA DQAAKRADDA 
VSGLKQTVQN AAADAASKVQ QAVERANSAT QAVDAVREKT EAANKQTETD LAALREEVVK 
AQRAGFTASS SAQKCDEAAQ AYRNVSGEVA QAKQTSEQAV EAANQALHTA QESAAAVAQA 
QSVLDQVKDA SETAKRVVSA VEELKQTNNA ALEATRTANA QASAAADAAG KANNATSTAN 
SAAQAANDAA GKVTQTLQES ETRFKAVEQA ANDAKSVAGT ANSTAEAARS TAEQAQSKAN 
DAAGSAQRAQ NTANSAIEAT DNNKNRIDSM ESDVSSLKNS CSAAQSKAND AAQTASKAQS 
VADSANSAAQ AAASKADSAQ QAVNNIRTPI VKPQSLTGYT TPSSWDWTLT DLKELPHGGH 
ILIYPQADSI KEYMRQQPEF EIEEQNGVRT GKITVITHQP NTNGSALKLV FVWFAD