Gene Aasi_1339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1339
Symbol
ID	6377649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	1706266
End bp	1707285
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	37%
IMG OID	642682420
Product	hypothetical protein
Protein accession	YP_001958375
Protein GI	189502658
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0812] UDP-N-acetylmuramate dehydrogenase
TIGRFAM ID	[TIGR00179] UDP-N-acetylenolpyruvoylglucosamine reductase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTTAC AAGAGAATAT TCCTTTACAA TCATTAAACA CTTTTGGGAT TGCTGCCACC 
GCACGCTACT ACAGTTTGGT TAAAAGCCAA GCTATGCTCA AGCAATTATT AAATAACAGC 
AGTTTACACT CTTTACTAAA ATTAACTATA GGAGGTGGCA GTAATATCCT TTTTGTAAAG 
GACTTCGATG GGTGGGTTAT ACACATGGAT ATAAAAGGAA TAGAAAAACT TGGAGAAGAT 
AATAATCATA TATGGTTGCA CGTAGGCGCT GGTGTAAACT GGCATAGTTT AGTTTTATAC 
TGCATAGAAA AAGGCTATGC AGGCATTGAG AATTTATCAT TAATTCCGGG TACGGTAGGC 
GCAGCACCTA TACAAAATAT TGGAGCTTAT GGAGTAGAAT TTAGTGAGGT ATTTGAATCC 
TTAGAAGCAC TTGAAATAAG CACAGGACTT ATTAAAAAGT TTAATAAAGA AGCTTGTGCT 
TTTAGTTATC GAGATAGCAT ATTTAAAAGC AGCCTGAAAG GACAATACAT TATTTTGCAA 
GTAACACTAC GCTTAAACAA GCAGCCCACT TTTCAGACAA ACTATGGTGC TATACAAGAA 
GTCCTAGCTT CCATGAAGCC TAGAACCTTA TCTATTAAAG CCATTAGTGA TGCGGTTATT 
TATATTCGCC AACAGAAACT TCCTAACCCA GCTTATATAG GCAATGCTGG GAGTTTTTTC 
AAAAATCCTA TTATCGACCA AGCTAAAGCT ACTCTACTTC GAAACAAATA CCCTAATATA 
CCAGTGCATA TTCTAGCAAA CGGTTATGCC AAACTACCTG CAGCTTGGCT TATAGAACAA 
TCTGGTTGGA AAGGATATAG GCACGATGCA GTAGGTGTAC ATTTACACCA GCCATTAGTT 
ATTGTTAATT ATGGAGGAGC AACAGGCAAA GCTGTATACA AGTTAGCACA AGCAATTCAG 
GCAAGTGTAG CCGAGAATTT TAGTGTTATG TTAGAACCTG AAGTTAATAT TATTCAATAA

Protein sequence

MDLQENIPLQ SLNTFGIAAT ARYYSLVKSQ AMLKQLLNNS SLHSLLKLTI GGGSNILFVK 
DFDGWVIHMD IKGIEKLGED NNHIWLHVGA GVNWHSLVLY CIEKGYAGIE NLSLIPGTVG 
AAPIQNIGAY GVEFSEVFES LEALEISTGL IKKFNKEACA FSYRDSIFKS SLKGQYIILQ 
VTLRLNKQPT FQTNYGAIQE VLASMKPRTL SIKAISDAVI YIRQQKLPNP AYIGNAGSFF 
KNPIIDQAKA TLLRNKYPNI PVHILANGYA KLPAAWLIEQ SGWKGYRHDA VGVHLHQPLV 
IVNYGGATGK AVYKLAQAIQ ASVAENFSVM LEPEVNIIQ