Gene Apar_1246 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1246
Symbol
ID	8414125
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1395274
End bp	1396899
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	55%
IMG OID	645022838
Product	carbohydrate kinase, YjeF related protein
Protein accession	YP_003180262
Protein GI	257785045
COG category	[S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCCGG TATTAAATGT TGAGGACATC AAGCGCGTAG AGATTGCGCT GACACGCGTG 
GGCGTAAGCG TTTCTGAGCT CATGCACCGT GCAGGTTACG CTGCTGCTCA AGAAGCCCTT 
GGCATGGGGG GAGACATTAG TAACGTTGTC ATCCTCGTAG GTCTTGGCAA TAACGGTGGA 
GATGGCTGGG TGGCAGCAGA AGCGCTGCGC TCTAGGAACT GCAACGTTAA GGTGGTTACT 
CCACTTGAGC CAGATCAGAT TTCCGGCGAT CTTGCACGTC AAATGGCGCA GCGCGCCGTT 
CGCGCGGGAG TTTCGGTGCT TGTTGGTCCT TCTCGCCAGG AGCTTATTGA TCTGTTGGCA 
ACAGCTGATG TGGTGCTTGA CTGCATGTTG GGTACCGGTT TTCACGGCAA AGTGAGAGCT 
CCGTTTGATA TTTGGATTGA GTGCCTTAAT CAGTCTGGCG CTCGCGTGCT CTCTGTTGAC 
GTTCCAAGTG GTCTTTCTGC GCAGAAGGGC CAGGTAGAAA GTGCGTGTGT TGTTGCTGAC 
GTCACCGTTA CCATGATTGC GCTGAAGCCC GGTCTAATTG CTGATGCTGG TCGAGATGTT 
TGTGGTTCTA TTGTTGTAGC TCCTTTGGCC GAGCAGACGG AGCGCTTGGT TGTTGAAGCA 
GATCCTGTTG CATGGCGCGT TGACTTGGAA GATTATCTTG CTTCTGTTCC TGCTCAGCTC 
AACGACTGTG ATAAGTATTC TCGCGGCTCC GTACTGGTGG TTGGTGGCTC TAGCCGCTTC 
CCGGGAGCCG CTGTTTTTGC TGCTAAGGCG GCTGCTCGTG CGGGTGCCGG CTACGTTACG 
CTGGCAGTCC CCGAGGCTAT TGTCAGCTGT GTTCAGATGA TGTTGCCAGA GGTTCCTGTT 
ATTGGCCTCC CATGCGATGC TGAGGGCGTG TTTACTGAGG AGGCCGCTCC ACTGGTGCTG 
CAGCTTGCTG CGATGCGTAC CGTTACGCTG GTTGGTCCTG GCATGCGCGT TTCTGGTGGA 
ACCGTTAAGG TTACCTCTGC ACTGCTTGAC TCTGAGCTGC CCGTTATTGT TGACGCTGAT 
GCACTCAACT GTATTGCTCG CCTGACTAAC AACAACCTTC CAGATTTCCC CGAGCTCACT 
CGTCGTACCG CTCCGCTTAT CATGACCCCA CATCGTCGTG AGCTTGGCCG CTTGGTCAAT 
CAGGTAGACA ATCCTCCTGC AAGCCTGGTG GCTCAGCTTG AGGCAGCTCG TAAGATTGTC 
TGGGCAGATG GTGGCTCTGA GCTGGTTATT GTTGCTAAGG GTACTGCTAC CGGCTGTGTA 
GGCGTCCAGA AAGCCGTGCT GCCAAAGCCT GGCCCTGTCA CGTTGGCAAC CGCTGGTTCT 
GGCGATGTTC TTGCTGGTAC CATTGCTGGC CGATTAGCTC AGGTTGCCGG CCAAGTTGAT 
GACCTGACAA TCTTCTGCTC GCTTGCTTGT GAGGTTCATG CATACGCAGG CCAGCTAGCT 
GCCGAGAAGT TCGGTGTACG TGGAGCTATG GCTGGTGACA TCTGCGATGT TATTGGCCTT 
GCTTCAGATG CACTTGAGGA GCAAATTGCG TTCCCTATGG CAGACTTTGA AGAAGCTGCA 
GAGTAG

Protein sequence

MQPVLNVEDI KRVEIALTRV GVSVSELMHR AGYAAAQEAL GMGGDISNVV ILVGLGNNGG 
DGWVAAEALR SRNCNVKVVT PLEPDQISGD LARQMAQRAV RAGVSVLVGP SRQELIDLLA 
TADVVLDCML GTGFHGKVRA PFDIWIECLN QSGARVLSVD VPSGLSAQKG QVESACVVAD 
VTVTMIALKP GLIADAGRDV CGSIVVAPLA EQTERLVVEA DPVAWRVDLE DYLASVPAQL 
NDCDKYSRGS VLVVGGSSRF PGAAVFAAKA AARAGAGYVT LAVPEAIVSC VQMMLPEVPV 
IGLPCDAEGV FTEEAAPLVL QLAAMRTVTL VGPGMRVSGG TVKVTSALLD SELPVIVDAD 
ALNCIARLTN NNLPDFPELT RRTAPLIMTP HRRELGRLVN QVDNPPASLV AQLEAARKIV 
WADGGSELVI VAKGTATGCV GVQKAVLPKP GPVTLATAGS GDVLAGTIAG RLAQVAGQVD 
DLTIFCSLAC EVHAYAGQLA AEKFGVRGAM AGDICDVIGL ASDALEEQIA FPMADFEEAA 
E