Gene Aasi_1784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1784
Symbol
ID	6376919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	1307690
End bp	1309225
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	34%
IMG OID
Product	hypothetical protein
Protein accession	YP_003573178
Protein GI	294661302
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATTCT CAAAAAAGGA AAATTATTTG GTTATTATGC TAGCCATCTG TTGCTTGCAA 
ATACTAGTTT CTTGTGGCTG CGGCAACAAT CCTACGTCTC TTATCACCAA AAAAAATCAT 
ATTCCAAAAA AAGTAAAGCC CATACCTCCT GTTCATCTTT TACTAAGTAG TAATAAACAA 
ATATTAAATA ATACTGACAA GAGTTTTAAC CTATCTTTAG AAAATACTTC AGCAACCATA 
GCTAATTTAA GCGATGGTAT ATTAAAAATA ACCTTACACG AGGAGGGTGG CTCAGGTAGT 
ACGTTACGCT ATGCAACTAA TACTAATATA TATGAGCATC AGAAAGCTGT TGAAAAGCCT 
TTGTCTTATT TTACTCAACA AGTAACTCTT AAAAAAGGTG ATGCTCCCTT GGTCATACCT 
TTTAAACTAC ACACTCTACC AACAGTTACA AGTGTTAAAA TAACAGTGAA GCTTGAATAT 
AAAGGTAAAA AGGATATTGT ACCCCCTCTA ACTATTGTAT GGGATGCAAT ATCACCCATT 
ACAGAGGATA TGATTCAAAG TGTTGTACAT AATGGTTATA AACTTTTGGC TGACATACTT 
ACCAAACTTC AAAAAGGAGA AGAGATAGCT ATTAATGATG TTACCGCAGT TTATCCAAAA 
GAAACGGCTT TACACCAAGC TGTAAAATTG GGTGACGAAT ATATTGTTGA ACTCTTATTA 
GAGAAAGGCG CAAGTATAAA TATACAAAAT ATAGAAGGAG AAACTGTCTT GCATTTGGCT 
ACTAATTCGA ATAATACAGA CTTAGCCAAA AAAATAATAG GTAAAGGGGC AAAACTAGAG 
GTGCAGAATA AGAGAGGTTA TACGCCTTTG CATTTAGCAG CCGAACAAGG TTATATAGAT 
GTTGCTAAAG AATTAATACC ACATTTAAAT AGCGAACAAT TAAATCTCGC AAACATAGAA 
GGGCAGACTC CATTACATTT AGCTGCTTCG TGGGGTCATA GTAAAGTTGT ATCATTATTA 
ATACCTTATT TGGACACATG GGAACTCAAC CAGAAAGATC TTCAAGGTAA TTCTGCACTA 
TATAAAGCTA GCCAATATGG ACATATAGAA ACAGTAAAGA GACTACTAGA TGCTGGCGCT 
AAAATAGATG AAGCCAATGG TCTTGGTTTT ACTCCGTTAC ATATTTCTAT TATTGAGGGG 
ACGTCTGCTG TGGCACGTGA ATTGACAAAT AGATTATCTA CAGAACAATT GAATCAACCA 
GATATAAACG AGTATACACC ACTATACCTT GCTATATTAC ACAGCCATAC AGAAATAGCT 
GAAGAATTAA TAAAAAAATT GGAGCCTGCA CAGTTAAATA AACAAAATGA TCAAGAGAAT 
ACCCCCTTAC ATAAAGCTGT TGAGAAGGGC AATATAAAAA TAGCTAAACA GCTTATTGCT 
AAAGGTGCAG ACATAACTAT AAAGAATAAA AAGGACCAGT CTCCAATGGA TCTAGCTAAA 
TTAGATGAGA TGAGAAGGAT ATTGCAACTT ATGTAA

Protein sequence

MQFSKKENYL VIMLAICCLQ ILVSCGCGNN PTSLITKKNH IPKKVKPIPP VHLLLSSNKQ 
ILNNTDKSFN LSLENTSATI ANLSDGILKI TLHEEGGSGS TLRYATNTNI YEHQKAVEKP 
LSYFTQQVTL KKGDAPLVIP FKLHTLPTVT SVKITVKLEY KGKKDIVPPL TIVWDAISPI 
TEDMIQSVVH NGYKLLADIL TKLQKGEEIA INDVTAVYPK ETALHQAVKL GDEYIVELLL 
EKGASINIQN IEGETVLHLA TNSNNTDLAK KIIGKGAKLE VQNKRGYTPL HLAAEQGYID 
VAKELIPHLN SEQLNLANIE GQTPLHLAAS WGHSKVVSLL IPYLDTWELN QKDLQGNSAL 
YKASQYGHIE TVKRLLDAGA KIDEANGLGF TPLHISIIEG TSAVARELTN RLSTEQLNQP 
DINEYTPLYL AILHSHTEIA EELIKKLEPA QLNKQNDQEN TPLHKAVEKG NIKIAKQLIA 
KGADITIKNK KDQSPMDLAK LDEMRRILQL M