Gene Apar_0014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0014
Symbol
ID	8412854
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	18834
End bp	20114
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	47%
IMG OID	645021581
Product	hypothetical protein
Protein accession	YP_003179044
Protein GI	257783827
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4573] Predicted tagatose 6-phosphate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.109361
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAGC TACCAATCAA AAAAGCTGTT GAAGGGTTGC TTAAACTTCA GGACACAGGA 
AGGTCCGCCA CGCTTTTAGG AATTGGACCA ATGTCGCCCA ACTTGCTTCA GGCAGCTTTT 
GAACTTGGTA GAGATTGCGA TTTTCCTCTA ATGTTCATTG CATCTCGAAA CCAGGTAGAC 
CTTGACGAGC TTGGTGGAGG ATACGTAAAC GCTTGGGATC AGAAGCGCTT CTCGGAAGAT 
ATTGCTGAAG CAGCTCAGAA GGTTGGTTTT GACGGTCTGT ATTATCTCTG CCGTGACCAC 
GGTGGTCCTT GGCAGCGCGA CGAGGAGCGC AATGCTCACC TTCCAGAAGA TGAGGCCATG 
GAGCTTGCTA AGAAGTCTTA TCTTGCCGAC ATGCTTAATG GCTTTGACCT GCTGATGATT 
GATCCAACCA AGGATCCCTT TGAGATTGGT AAGGTCATTC CGCTAGATGT GGTTCTTCGT 
CGTACGGTTG ATTTGATTGA GTGGTGCGAG AAGGAACGTG TTTCTCGCGG TCTTCCCGAG 
ATTGGCTATG AAGTTGGTAC CGAGGAAACA AACGGTGGCT TGACCTCAAC CGATAAATAC 
CACACCTTTA TTGAGCAGCT TAAGAGTGAG CTGACTGCCA AGGGTTTGCC TATGCCAACT 
TTTATTGTGG GACAGACGGG AACGCTCACC CGTCTTACTG AGCAGGTTGG CCATTACGAT 
TTTGAGGCTG CATTTAGCTT GTCTAAGATG GCCAAGAGCT ACGGCGTTGG TCTTAAGGAG 
CACAATGCAG ACTATCTTGA CGACGTAACA CTACTTGAAC ACACTCCAGC AAACGTTACC 
GCTTCAAACG TAGCTCCACA ATATGGAACG GAAGAGACTC GTGCATATCT GAAACTTTGC 
GATGTTGAAG ATCTTTTGGT TAAAGAAGGT CTATTGAAGT CGGATGAAGT TTCTGGCTTG 
AGGAATACCC TGTTAGTAAA GGCAATTGAG ACTGAACGCT GGCGTAAGTG GATGGTAGGT 
AATCAAGTTA ATCTGACCGT TGAGCAGATT CTTGCTGATC ACAAACTCTC ACTAGATATT 
CTTGATATTT CCGGTCACTA TGCGTTCAAT GATGACGAGG TCAAAGCTGC AACTGAGCAC 
CTGTATAAGA ACCTTGCCCA GTTCAATATT GATGGTCAGC GCTTTGTGGT TGATCACATT 
AAGCGCCCTC TTCGCCAGTA CGTTGAATGC TACAGGCTTG AAGGAGTTAC TACGCGTATT 
CGCGAGGCGC TGGCAGAGTA G

Protein sequence

MEKLPIKKAV EGLLKLQDTG RSATLLGIGP MSPNLLQAAF ELGRDCDFPL MFIASRNQVD 
LDELGGGYVN AWDQKRFSED IAEAAQKVGF DGLYYLCRDH GGPWQRDEER NAHLPEDEAM 
ELAKKSYLAD MLNGFDLLMI DPTKDPFEIG KVIPLDVVLR RTVDLIEWCE KERVSRGLPE 
IGYEVGTEET NGGLTSTDKY HTFIEQLKSE LTAKGLPMPT FIVGQTGTLT RLTEQVGHYD 
FEAAFSLSKM AKSYGVGLKE HNADYLDDVT LLEHTPANVT ASNVAPQYGT EETRAYLKLC 
DVEDLLVKEG LLKSDEVSGL RNTLLVKAIE TERWRKWMVG NQVNLTVEQI LADHKLSLDI 
LDISGHYAFN DDEVKAATEH LYKNLAQFNI DGQRFVVDHI KRPLRQYVEC YRLEGVTTRI 
REALAE