Gene Apar_0464 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0464
Symbol
ID	8413313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	533833
End bp	534831
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	46%
IMG OID	645022032
Product	Protein-N(pi)-phosphohistidine--sugar phosphotransferase
Protein accession	YP_003179486
Protein GI	257784269
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2893] Phosphotransferase system, mannose/fructose-specific component IIA [COG3444] Phosphotransferase system, mannose/fructose/N-acetylgalactosamine-specific component IIB
TIGRFAM ID	[TIGR00824] PTS system, mannose/fructose/sorbose family, IIA component [TIGR00854] PTS system, mannose/fructose/sorbose family, IIB component

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000027828
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.826743
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTAGTA TCGTTCTAGC CAGTCATGGT AAGTTTGCCG AGGGTATTAA AGATTCTGGC 
AGCATGATTT TTGGACCACA GGAAGGCGTT GTAGCTATTA CGCTTACTCC TGATATGGGT 
CCAGATGACC TGCATCAGAA GATTCTCGAC GCAATTACCA CGCTTGAAGA TCAAGAGCAC 
GTTCTGTTCT TGGTTGACCT ATGGGGTGGC ACTCCCTTTA ACCAGATTTC TCGTGTTCTT 
GAGGAGGAGG GTAAAGAAGA TTGGGTTGCT GTTACTGGTC TTAACCTCCC AATGCTTATA 
GCAGCATATG GTTCTCGCCT TGGCGTAGAT ACCGCCACCG AGGTAGCAAA AGAGATTTTC 
TCTGAAGCTC GTATGGGCGT AAAGATTAAG CCAGAAGAGC TTGAGCCACA AGAGGCAACA 
CCTACTGATG TTCCTGCTGT TGCAACACCT AAGGGAGCAA TTCCTGTGGG AACCGTAATT 
GGTGATGGCA AGCTTAAGAT TGTTCTTGCT CGTATTGATA CCCGTCTTCT GCATGGTCAG 
GTTGCAACTA CCTGGACAAA GATGACCAAG CCAGACCGTA TCATTGTTTG TTCTGATGGT 
GTTGCACAAG ATGAGCTTTG CAAGACCATG ATTGTTCAAG CAGCTCCTCC AGGAGTGCAC 
GTTCACGTTG TTCCTATTAA GAAGATTATT GAGATTGCTC ACGATACTCG TTTTGGTAAT 
ACCAAGGCAA TGCTCCTGTT CGAGACTCCT CAGGACATGC TTCGTGTCAT TGAAGGTGGC 
GTAGAAATCA AGGAAGCTAA TCTTGGTTCT ATTGCTCACT CTGTTGGTAA GGTTGTTGTT 
ACCAACGCAG TTGCTATGGA CGAAGACGAT GTAAAGACCC TTGAGGCTAT CCGAGAGTGC 
GGTACAAAGT TTGATGTCCG TAAGGTTCCT GCAGACAGTG CAGAAAACTT TGATGCAATG 
CTTAAAAAAG CTAAGTCCGA GCTTGCTAAT CGTAAGTAA

Protein sequence

MVSIVLASHG KFAEGIKDSG SMIFGPQEGV VAITLTPDMG PDDLHQKILD AITTLEDQEH 
VLFLVDLWGG TPFNQISRVL EEEGKEDWVA VTGLNLPMLI AAYGSRLGVD TATEVAKEIF 
SEARMGVKIK PEELEPQEAT PTDVPAVATP KGAIPVGTVI GDGKLKIVLA RIDTRLLHGQ 
VATTWTKMTK PDRIIVCSDG VAQDELCKTM IVQAAPPGVH VHVVPIKKII EIAHDTRFGN 
TKAMLLFETP QDMLRVIEGG VEIKEANLGS IAHSVGKVVV TNAVAMDEDD VKTLEAIREC 
GTKFDVRKVP ADSAENFDAM LKKAKSELAN RK