Gene Apar_0600 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0600
Symbol
ID	8413457
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	668626
End bp	670329
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	50%
IMG OID	645022175
Product	phosphoenolpyruvate-protein phosphotransferase
Protein accession	YP_003179621
Protein GI	257784404
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1080] Phosphoenolpyruvate-protein kinase (PTS system EI component in bacteria)
TIGRFAM ID	[TIGR01417] phosphoenolpyruvate-protein phosphotransferase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.12696
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.706095
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGAGG GAGTCAATGC GTCTAACGGA ATCGGCATCG GTGCTGCTCA GGTTGCTGTA 
GATCCAGATC TTACTTTTAC TCCGCACACT GTTGAAGACA CTGCTGCAGA GAAGGCTCGT 
TACGCAGAGG CTGTAACTAA GTTCATCGCA CAGACTAATG CGCAAATTGA GCGTATGACT 
AAGACGGTGG GTGAGGAAGC TGCTGCAATT ATGGGTGCTC ACATTGAGTT TGCAGAGGAT 
GAGGGCATCA AAGAGGCCGT TAACAGCGCT ATTGACGGTG GTACCTGTGT TGAGCAGGCT 
GTAAGCGACG CATATGACAT GTATTACAAC ATGTTCCTTG GCATGGAGGA TGAACTCTTC 
CGTGAGCGCG CAGCAGACGT TGCAGACGTA AAGACTGGTC TTCTCGCTGA TCTTCTTGGC 
AAAGAGGTTG TTGACCTCTC TACGCTTCCA GAGAACTCCG TCATTGTCTG CCGTGAGCTG 
ACTCCTTCAA TGACCGCAGA TATTGATAAG GACCACGTTG CAGGTATTGT TACCGAGACT 
GGTGGTCGTA CTTCTCACTC CGCAATCATT GCTCGTGCTC TTGAGATCCC TGCAGTTCTT 
TCTGTTCCTA ACATCACTTC TGAGGTTGCA ACTGGCAACG CTATTGTTGT CGACGGCACT 
AACGGCAAGG TTGTTGTTAA TCCTTCTGAG GCTGAGCTTG CTGAGTACAA GGCTCAGGCT 
GAGGCTTACG CTGCAGAGAA GGCTGCTCTT GAGGCTTATC GCGGTAAGGA GACCGTAACT 
GCTGACGGCA TTAAGGTTCT GCTTGTTGCT AATATCGGTA ATCCAGATGA CGCTAACGGC 
GCAGTTGACG CTGATGCTGA GGGTATCGGT CTTTTCCGCT CCGAGTTCCT GTTCATGGAT 
GCAAAGGAGC TGCCAAGCGA GGAAGAGCAG TTTGCTGCTT ATCAGAAGGT TGCTCTGCGC 
ATGAAGGATA AGCCAGTCAT CATCCGTACT CTTGATGTCG GTGGTGATAA AGAGATTCCT 
TATCTCAACA TGAAGGCTGA GGAGAATCCA TTCATGGGCT TCCGCGCTAT TCGCTACTGC 
CTTAACAATG CTGAGCAGTA CAAGGTTCAG CTCCGCGCCC TTCTCCGTGC ATCTGCATTT 
GGTGACATCA AGATTATGCT TCCTCTTGTC ACTACTGTTG ACGAGGTTCG TCAGGCAAAA 
GCTCTTGTTG AGGAGTGCAA GGGTGAGCTT GACGCTAAGG GTGTAGCATA CAACAAAGAT 
ATTGAGGTAG GCACCATGAT CGAGACTCCA TCTGCATCTC TGATTGCAGA TAAGCTGGCT 
CGTGAGTGCG ATTTCTTCTC CATTGGTACC AATGACCTTA TTGGCTACAC CATGTGCGCC 
GACCGTGGCA ATGATCGCGT TGCATATCTC TACGAGGTCT ATCAGCCATC CGTCCTCCGT 
TCCCTCAAGT ACCTCATTGG TGAGGGTAAC AAAAAGAAGA TTATGGTTGG CATGTGCGGT 
GAGGCAGCTG CAGATCCACT GCTCATCCCA GTCCTTCTTT CCTTTGGCCT GGATGAGTTC 
TCCGTCTCTG CTCCATCTGT CCTGCGTACC CGCAAGACCA TTGCAGCTTG GACAAAGGCT 
GAGGCAGACG AGCTTACTGC TCGTGTCATG GAGCTTGATA CCGCAGCTGA GGTTAAGGCT 
CTGCTTGAGC GTGAAGCTCG CTAA

Protein sequence

MFEGVNASNG IGIGAAQVAV DPDLTFTPHT VEDTAAEKAR YAEAVTKFIA QTNAQIERMT 
KTVGEEAAAI MGAHIEFAED EGIKEAVNSA IDGGTCVEQA VSDAYDMYYN MFLGMEDELF 
RERAADVADV KTGLLADLLG KEVVDLSTLP ENSVIVCREL TPSMTADIDK DHVAGIVTET 
GGRTSHSAII ARALEIPAVL SVPNITSEVA TGNAIVVDGT NGKVVVNPSE AELAEYKAQA 
EAYAAEKAAL EAYRGKETVT ADGIKVLLVA NIGNPDDANG AVDADAEGIG LFRSEFLFMD 
AKELPSEEEQ FAAYQKVALR MKDKPVIIRT LDVGGDKEIP YLNMKAEENP FMGFRAIRYC 
LNNAEQYKVQ LRALLRASAF GDIKIMLPLV TTVDEVRQAK ALVEECKGEL DAKGVAYNKD 
IEVGTMIETP SASLIADKLA RECDFFSIGT NDLIGYTMCA DRGNDRVAYL YEVYQPSVLR 
SLKYLIGEGN KKKIMVGMCG EAAADPLLIP VLLSFGLDEF SVSAPSVLRT RKTIAAWTKA 
EADELTARVM ELDTAAEVKA LLEREAR