Gene Apar_1064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1064
Symbol
ID	8413937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1207910
End bp	1208989
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	46%
IMG OID	645022653
Product	PTS system mannose/fructose/sorbose family IID component
Protein accession	YP_003180083
Protein GI	257784866
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3716] Phosphotransferase system, mannose/fructose/N-acetylgalactosamine-specific component IID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.309929
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATTTA ATATTCCTGA TACCTATCAG AACACCACTC CTGCTGAGCC ACTTGATCAG 
AAGACACTCA ACAAGATGGT GTGGCGTTCC CTGTTCCTGC AGGCTTCCTT CAATTACGAA 
AGAATGCAGG CAGCTGGTTG GCTTTACGGT ATCCTTCCAG GTCTTGAGAA GATTCACGGC 
GACAACAAGG ATGACCTTGC TGCTTCCATG AGTCACAACC TTGAGTTCTT TAATACCCAC 
CCATTTTTGG TTACTTTTGT TATGGGTATT GTTCTCTCTC TTGAGCAGAA CAAGCTGGAT 
ATTCCAACCA TTCGTGCAGT CCGCGTTTCT GCAATGGGTC CTCTAGGTGG CATTGGTGAC 
GCACTGTTCT GGTTCACTCT TGTTCCAATT ACTGCTGGTA TTACCTCTAA TATGGCAATC 
TCTGGCAACG TCTTTGCGCC ATTTTTGTTC CTCATCATCT TCAATATTGC ACAGTTTGCT 
GTACGTTATT GGCTGATGAA CCTTTCCTAC AAGATGGGCA CTGATGCAAT TACCCTGCTT 
ACCGAGAATG CAAAAGAGTT CACTCGTGCT GCTTCTATCT TGGGTGTCTT TGTTGTTGGT 
TGCTTGGTTG TTTGCTACGG CGGAACCAAG CTTGGCGTTG GCGCAAACAT CCCTAACGGT 
GAGACACACA GTGTTGTTCT TTCTCAGGTA ACTCTTTCTG ATGAGCAGCT TGCTTCTGGT 
CAGTATGACA AGGTACTCTT TGCTGAGGGC AGCTATGCAG ACTACAAGAA GAATCCTGAG 
TCCGTTAAGT TCCTCGGTGG CAAAACTGCT GACGGCAAGG ATGGCACCGC TGCTATTACT 
CCAGTCGGCA ACGGCGTTAA CCTGGTAACT ATTGGCAAGG AAGTCACTTC TCCTGTCTCT 
ATTGACATTC AGAAGATTCT TGACGGCGTT TGTCCAAAGC TTATTCCATT GGCTCTTACC 
CTTTGCTTGT ACTATCTCAT GGCAAAGCGT AACTGGACTC CAATTATGTG CATCTGCCTT 
CTTCTGGTAA TTGCACTCCT TGGCTCTGGC TTTGGTGTTC TCCCATATAT TTGGGGGTAA

Protein sequence

MAFNIPDTYQ NTTPAEPLDQ KTLNKMVWRS LFLQASFNYE RMQAAGWLYG ILPGLEKIHG 
DNKDDLAASM SHNLEFFNTH PFLVTFVMGI VLSLEQNKLD IPTIRAVRVS AMGPLGGIGD 
ALFWFTLVPI TAGITSNMAI SGNVFAPFLF LIIFNIAQFA VRYWLMNLSY KMGTDAITLL 
TENAKEFTRA ASILGVFVVG CLVVCYGGTK LGVGANIPNG ETHSVVLSQV TLSDEQLASG 
QYDKVLFAEG SYADYKKNPE SVKFLGGKTA DGKDGTAAIT PVGNGVNLVT IGKEVTSPVS 
IDIQKILDGV CPKLIPLALT LCLYYLMAKR NWTPIMCICL LLVIALLGSG FGVLPYIWG