Gene Apar_0320 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0320
Symbol
ID	8413168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	366605
End bp	367573
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	52%
IMG OID	645021887
Product	ROK family protein
Protein accession	YP_003179342
Protein GI	257784125
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID	[TIGR00744] ROK family protein (putative glucokinase)

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0261245
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATACG TATTGGGCAT TGATGTTGGT GGTACCACCA TTAAACTGGG ACTTTTCTCC 
ACAGAAGGAG AGCTGCTTTC TGAGCAGAAG GTCAAGACGC CTGCACTTGA TAACGAGGAC 
GGTTATCAGA CGGTAACCGA TGCAATTAGG CTTATTGTTC ATGGTCAAAA AGCAAGCCGC 
AATGATGTTA TTGCGTGTGG TTTGGATATT CCAGGTCCTG TTGCAGATGA TGGAACCGTC 
GGTTTTCTCG CTAATGTAGA CATTGACCCT GAGGGATTGG TACAGGCAAT TAATATGTGC 
TTGCCAAACG CAACCATCGC GTTTGTTAAT GACGCAAACG CCGCGGCTTT GGGCGAAGCG 
TGGGCTGGCG TTGCCGTGGG CGTGCCGTCG TTTGTGCTGA TTGCGTTGGG AACAGGTGTT 
GGCGCAGGCG TTGTAGTAGA CGGTAAGCTT GCTGCAGGTG CTTTTGGCGC TGGTGGCGAG 
ATTGGCCACA TTATTGTTGA GCCAGAAGAA ACTTTGACTT GTGGCTGCGG TCGTCATGGC 
TGCCTGGAGC AGTACGCTTC CGCTAAGGGA GTTGTTCGCT TGTACCTGGA GGAATGCGCC 
GCTCGTGGTG TTGTTCCTGT GAACATTGAG CACGAGACTG ATACCGTGTC CGTGTTTAGA 
GCCCATGCTC AAGGAGATGA GTGCGCAACC CTTGCTATCC ACAAGATGTG TCACTACCTT 
GGCCTTGCTA TGGCGCAGGT TTCGTGCGTG GTTGATCCTG CTATGTTTTT GATTGGCGGT 
GGCGTAGCAG GCTCGTTTGC AACATTTGCG TTGGAGCTTC GCGAGACCTT TGAGCAGTAT 
GCTCTACCGG TTAGCAAGGG CGCTCGTATT GAGGCCGCTA GCTTGGGTAA TCAGGCTGCA 
ATGTATGGTT GCGCATATGA GGCGTTGCGT CTTAGAAAAG AACGCTTTGG CCAGGAGGAA 
GCAGAGTAG

Protein sequence

MEYVLGIDVG GTTIKLGLFS TEGELLSEQK VKTPALDNED GYQTVTDAIR LIVHGQKASR 
NDVIACGLDI PGPVADDGTV GFLANVDIDP EGLVQAINMC LPNATIAFVN DANAAALGEA 
WAGVAVGVPS FVLIALGTGV GAGVVVDGKL AAGAFGAGGE IGHIIVEPEE TLTCGCGRHG 
CLEQYASAKG VVRLYLEECA ARGVVPVNIE HETDTVSVFR AHAQGDECAT LAIHKMCHYL 
GLAMAQVSCV VDPAMFLIGG GVAGSFATFA LELRETFEQY ALPVSKGARI EAASLGNQAA 
MYGCAYEALR LRKERFGQEE AE