Gene Aasi_1502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1502
Symbol
ID	6376588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	-
Start bp	235106
End bp	236866
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	36%
IMG OID
Product	hypothetical protein
Protein accession	YP_003572994
Protein GI	294661119
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATC TTATTCGAAT TGCAGCACTT ATTTTAATGC TTCTTGCGCT ATGGGCTTAT 
TTGAAAAGCA AGAAAGACTC CTCACCTAAA GTAACAGAAA AAGTATTGTA TACAGCTAAT 
GAGGCACAGA TTAAAACATT AGATCCTGCC CAAGCTGAAG ACCATTATTC TAATAGAGAA 
GTAGCTAAAG TTTATGAAGG TCTGTTAGAA TTTCATTACC TTAAAAAGCC ATTCGAGCTA 
ACTCCTAATC TAGCGGAAGA AATGCCTGAA GTGTCAGCAG ACCAGCTGGT TTATACCTTT 
AAAATTAGAC GAGGTGTAAA GTTTCATGAC AACCCTTGCT TTCCTAATGG TAAAGGGAGA 
GAACTGACGG CGCATGATTT TGTATATTCT TTTAAAAGGT TAGCTGATCC TAAGCTTCAA 
GCAAAGAACT TTTGGCTAAT CAATAACAAT CTAAAGGAAG TTAATGCATG GAGAGAAAGA 
TATGCCGATG CTATACAGGC CAATTATGAC GAAGAAATAG AGGGAGTAAA AGCTATAGAC 
CGCTATACAC TGCAGTTCAC TTTAACAAGA CCTAATCCAC AATTTCTATA CTTTTTAGGT 
ATGTCGGGAT GTTACGTGGT TCCTCGTGAA GCAGTAGAGC ATTATGGTAT GGAGTTTACT 
AATCATCCTG TAGGAACAGG AGCTTTTATG TTAGAAGCTT TTAATCCACA AGATAGTAAG 
CTAGTATACC GCAAAAACCC TACTTTTAGA GATAAACGTT TCCCTAGTGA ATCTATAGAA 
GAATATAAAC ATATGCTAGC TTATGCTGGG AAGCAGTTGC CTTTTGTAGA CAAAATAGTT 
ACTTATATCC TTACTGAGGC ACAACCTAAA TGGCTTAAAT TTAAAAAGGG TGATTTAGAT 
ATAATTGATA TTACTAAAGA TAAAATTGCC TTAGATGTAG TGCGAAACGG TGAGTTAATT 
CCTGATCTTA AAGAAAAAGG CATTAACCTA TATAGCGTAG CTGAATTAAG TACTACTTAT 
GTTGTTATGA ACTGTGCTAA TCCTTTATTT AAAGATAATC TTAAGCTTCG GCAAGCTATG 
GCATTAGCAT TTGACAAAGA AGGTTATAAT AAATTGTTTC ATAATAATAC AGCAGTAGTA 
GCACAATCAA CTGTTCCTCC TGGGCTAGCT GGCTACAGAG AAGATTATAT AAATCCTTAT 
GGTATCTATG ATATTGAAAA AGCTAAACAA TATTTAGCAG AGGCAGGTTA TCCTGAAGGC 
AAAGGATTGC CTGAGCTTAC ACTAGATGCG GGGCCTGATG CCGAACTAAG ATTAAAAGGA 
GAATTTTTTC AGAAATGCAT GGCTAAAATA GGCGTACGTA TTAAAGTAGT CGGAAATATT 
TTTCCAGAAT TAATAAAAAA AATTAATAAT CAAGCTACCA TGCTACATAG TATTTCTTGG 
AGTGCAGATT ACCCAGACGC ACAAAATTTC TTCATGCTCC TGTATGGTCC TTACCAACCA 
GGTGGCATTG GATCTAATTT AAACGACTCT GCTTATGATG CTTTATATGA AAAGGCTGTA 
GCTATGCTAG ATTCTCCTGA AAGAACTAGG CTTTATGAAC AGCTTAATGA AATGATAGCT 
GAAAAGACAC CTTTTATTTG TACTGTACAT TTTCCCCATA CTGGTTTGCA GCATGGGTGG 
GTCAAGAACT ACTGTTGGTC TAACTTCCAT TATGGCACAG AACAATATTT TGATATAGAT 
TTAGAACAAA AAAACAATTA G

Protein sequence

MKNLIRIAAL ILMLLALWAY LKSKKDSSPK VTEKVLYTAN EAQIKTLDPA QAEDHYSNRE 
VAKVYEGLLE FHYLKKPFEL TPNLAEEMPE VSADQLVYTF KIRRGVKFHD NPCFPNGKGR 
ELTAHDFVYS FKRLADPKLQ AKNFWLINNN LKEVNAWRER YADAIQANYD EEIEGVKAID 
RYTLQFTLTR PNPQFLYFLG MSGCYVVPRE AVEHYGMEFT NHPVGTGAFM LEAFNPQDSK 
LVYRKNPTFR DKRFPSESIE EYKHMLAYAG KQLPFVDKIV TYILTEAQPK WLKFKKGDLD 
IIDITKDKIA LDVVRNGELI PDLKEKGINL YSVAELSTTY VVMNCANPLF KDNLKLRQAM 
ALAFDKEGYN KLFHNNTAVV AQSTVPPGLA GYREDYINPY GIYDIEKAKQ YLAEAGYPEG 
KGLPELTLDA GPDAELRLKG EFFQKCMAKI GVRIKVVGNI FPELIKKINN QATMLHSISW 
SADYPDAQNF FMLLYGPYQP GGIGSNLNDS AYDALYEKAV AMLDSPERTR LYEQLNEMIA 
EKTPFICTVH FPHTGLQHGW VKNYCWSNFH YGTEQYFDID LEQKNN