Gene Apar_0321 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0321
Symbol
ID	8413169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	367770
End bp	369275
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	50%
IMG OID	645021888
Product	PTS system, fructose subfamily, IIC subunit
Protein accession	YP_003179343
Protein GI	257784126
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1299] Phosphotransferase system, fructose-specific IIC component
TIGRFAM ID	[TIGR00829] PTS system, fructose-specific, IIB component [TIGR01427] PTS system, fructose subfamily, IIC component

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0357184
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTGACG AGTCAAAGTA TGACATCGTT GCTGCTACTG GTTGTCCAAC CGGTATCGCG 
CACACCTTTA TGGCTAAGGA GGCCCTTGAG AAGGCCGCCG CAGCTAAAGG TCTTACCATT 
AAGGTTGAGA CGCACGGTCA GGTCGGTGTA GAGAACGAGC TTACCGCAGC TGAGATTAGG 
AACGCCAAGG CAGTAGTTGT TGCTGCCGAT AAGGACGTTC AGGCTGAGCG TTTTGCCGGA 
AAACCAATGG TAAATGTTGG CGTTACAGCA GCTATTAAGG ATGCGGAAGG TCTCATTGAC 
CGTGCACTTG TTGCTCAGCC TGAGGGTGAG CTTGCAGAAG CAGACGATGC CCCAGTCTCA 
AGTACCATTG AGAAAGAGTC TGTAGGCCAC ACTATCTACA AGCACCTTAT GAATGGCGTT 
AGCCACATGC TGGTCTTTGT TGTTGCTGGT GGTGTTTTGA CCGCAGTTTC ATTCCTCTGG 
GGCATCACTT CCTTCAGCTC CACTGAAGCT GACTACAACA GCTTTGCTGC CATGCTCAAG 
ATTATTGGTG GCATTGCAAT GGGCCTTATG GTTCCAGTCC TTTCTGCTTA CATTGCTGAG 
TCTATTGGCA AGCGTCCTGC CCTGGTTCCT GGTTTTGTTG CAGGTATGAT TGCTATCCAA 
GGTCTTCCAA TCAACCCTAA TACCGGCATG ATTGATGCTG TTGGCGCTGG TGTTGGCTTT 
GGCTTCCTGG GCGGCATCGT CGGCGGCTTC CTTGCTGGTT ATGTTATCGT TGGTCTTGAG 
AAGCTTCTTT CTGGTCTTCC AAAGAACCTT GATGGCTTGA AGGCAATTTT CCTGTATCCT 
CTGCTTTCTA CCACCATTGT TGGCCTGGTT ATGCTGGGCA TTTCTGGTCC TATGGCAGCA 
ATCAACACTG GCATGATGAA CTTCCTGCGC GGTCTGTCTG CTTCTGGCCC AATTGTCCTC 
GGCCTTGCAA TTGGTTGCAT GTGCGCATTT GATATGGGTG GTCCAGTCAA CAAGGCAGCT 
TACGTTACCG GTACAGCACT TCTGACTGAG GCTCTCAATG CTGGCATTGG TACTCCAACC 
TATGAGTTTG GTACCAACTT TATGGCTGCA GTTTCCGCTG CGTGTATTGT TCCTCCACTG 
ATTACAACCT TTGCTGTTGT CGTTGGTAAG AAGTACTTTA CTAAGCCCGA TTTCAACGCT 
GGTTTGGTCA ACTTCATTCT TGGCTGCACC CACATTACCG AGGGCGCAAT TCCATTCATG 
ACCAAGAACA TTTGGCCTGT TATGCCTATT ATGATGATCG GTTCTTCCAT CGGCTCCATT 
TTGACCCTGC TCTTTGGTGT TCACGATCCA GCACCTCACG GTGGTTTCTT GGTTCTTCCA 
GTTGTTGATG GCGGCCTTAA GTGGGTTCTC GCTATTCTTA TTGGTGCTGT TGTTGGTGGC 
ATTCTCTTTG TTGCTTTCAA AGCATACGAG TACCGCAAGA ACGGCGACAA GATTGTCGAG 
GACTAA

Protein sequence

MADESKYDIV AATGCPTGIA HTFMAKEALE KAAAAKGLTI KVETHGQVGV ENELTAAEIR 
NAKAVVVAAD KDVQAERFAG KPMVNVGVTA AIKDAEGLID RALVAQPEGE LAEADDAPVS 
STIEKESVGH TIYKHLMNGV SHMLVFVVAG GVLTAVSFLW GITSFSSTEA DYNSFAAMLK 
IIGGIAMGLM VPVLSAYIAE SIGKRPALVP GFVAGMIAIQ GLPINPNTGM IDAVGAGVGF 
GFLGGIVGGF LAGYVIVGLE KLLSGLPKNL DGLKAIFLYP LLSTTIVGLV MLGISGPMAA 
INTGMMNFLR GLSASGPIVL GLAIGCMCAF DMGGPVNKAA YVTGTALLTE ALNAGIGTPT 
YEFGTNFMAA VSAACIVPPL ITTFAVVVGK KYFTKPDFNA GLVNFILGCT HITEGAIPFM 
TKNIWPVMPI MMIGSSIGSI LTLLFGVHDP APHGGFLVLP VVDGGLKWVL AILIGAVVGG 
ILFVAFKAYE YRKNGDKIVE D