Gene Aasi_1520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1520
Symbol
ID	6377752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	306702
End bp	308489
Gene Length	1788 bp
Protein Length	595 aa
Translation table	11
GC content	36%
IMG OID
Product	hypothetical protein
Protein accession	YP_003573007
Protein GI	294661132
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGC CGCTTGCCAG CTCCTTTTTA CAGTTATTAC TTTACATGCG CCCTTTTCGC 
AGGATATATC TTTCTGCGAC TTTATATTCT TTTCTAAATA AATTATTTGA TCTCATGCCA 
GAGATATTGC TAGGTATTGC TGTAAACACA GTAGTAGCTA GGGAACAATC ATGGCTAGCC 
AATTTAGGTT TTTGTGACCT TAAGATACAG CTTATCTTGC TGGGCTTAAT GACAATGGTT 
GCCTATGGGC TAGAATCATT ATCTGAATAT TTATTTTCTA TCCGATGGTG GAATCTTGCT 
CAAATTGTAC AACATAATTT TAGAATGCAA GCCTTTGAAC ATGTTCAAAA AAGTACTATC 
ACTTCTTTTT CTAAACAAAA AACAGGAAAT CTTCTTTCTA TTCTCAACGA TGATATCAAC 
CAGCTTGAAA GATTTTTAGA AGAGGGTATA GATAAAATTA TTGAGGTTAT TGGTACTAGT 
ATCTTTGTAG GTAGTATCTT CTTTTTCCTC GCGCCTCAAA TAGCAATATT TGTTGTTATT 
CCTATCCCAA TTATTATATA CAGTACCTTT CGGTTTCAAA AAAAGCTAAG TCCATATTAC 
CTAAATATAA GGGAAAAAGC AGGGCTTGTA GGTGCTTTTC TAGCAAACAG CCTATTAGGG 
TTATTAGCAA CAAAAAGTTT AGTAGCCGAA CAACTTGAAA AAAAGAAACT AGAAAAAGCT 
AGTATGGCTT ATAAAGATGC TAGCTTCAAT GCTATCCGTT GGGGAGCACT TTTGGTCCCT 
ATCATACGCT TTGTTATATT GTCAGGTATC TTAGTAACCT TAATTTATGG GGGTAAATTA 
ACGATAGAAC AAAAGTTAGA TGTAGGTGTT TACAGTATTC TTATATTCCT TACACAACGG 
TTACTTTGGC CTTTTACAGA AATAGCAGAT ATCATGATTA ATTTCCAGCG CGTAATGGCT 
TCTACCCAGC GCCTGTTAAA TTTATTTGAA TTACCAACCG AAAACTCCCC TGATAATATA 
GTGCCCATTA AAGGAAGAAT TACATTTGAT GATGTTAGTT TTTCTTATCA TAATCATACA 
CCTAGTTTGC ATAACCTTAC CTTTGCAACA GAACCCGGAC AGCATATAGC CTTCGTAGGT 
GCCACAGGAG CTGGTAAATC CACCTTATTA CATCTGCTAT TAGGGTTTTA CCTACCTACT 
TCAGGTAAAA TTTTCTTTGA TAATAAAGAA ATCCGAGAAC TTTCTCTTCC AGGCTTAAGG 
AAACAGTTAG GTTTTGTAAG CCAAGAACCC TTTCTTTTTG AAGGTACTAT AGCTGAGAAT 
ATTAGCTATG GTTATGTAGA AGCTACTCCT GAACAAATTA TAGAAGCAGC AAAAAATGCA 
GCAGCACATG AGTTTATTAT GAGGCTTCCA GAAGGGTACG ACACAATAAT TGGAGAACGT 
GGCCAGAACC TGTCAGGAGG GCAAAAACAA CGCCTTGCTA TTGCAAGAGC TATTGTACGT 
AATCCAACTA TTCTTATTCT AGATGAAGCG ACTTCTTCGG TTGATAATGC TACTGAATTG 
GCCATTCAAA GGTCATTATC TAAGATTGGG CAAGGAAGGA CAATGATACT TATTGCTCAT 
CGACTTTCTA TGGTTAAACA TGCCGATAAA ATCTTTGTAT TAAAGAAGGG ATCAATTGCA 
GAGCAAGGAA CACATGAAGA ATTGCTCCAG CATGATAATG TGTATGCTAA TCTTTGGAAG 
CTACAAATGG GCGAAACATT AACACATCCT GAACTGATTA TTGATTAA

Protein sequence

MKKPLASSFL QLLLYMRPFR RIYLSATLYS FLNKLFDLMP EILLGIAVNT VVAREQSWLA 
NLGFCDLKIQ LILLGLMTMV AYGLESLSEY LFSIRWWNLA QIVQHNFRMQ AFEHVQKSTI 
TSFSKQKTGN LLSILNDDIN QLERFLEEGI DKIIEVIGTS IFVGSIFFFL APQIAIFVVI 
PIPIIIYSTF RFQKKLSPYY LNIREKAGLV GAFLANSLLG LLATKSLVAE QLEKKKLEKA 
SMAYKDASFN AIRWGALLVP IIRFVILSGI LVTLIYGGKL TIEQKLDVGV YSILIFLTQR 
LLWPFTEIAD IMINFQRVMA STQRLLNLFE LPTENSPDNI VPIKGRITFD DVSFSYHNHT 
PSLHNLTFAT EPGQHIAFVG ATGAGKSTLL HLLLGFYLPT SGKIFFDNKE IRELSLPGLR 
KQLGFVSQEP FLFEGTIAEN ISYGYVEATP EQIIEAAKNA AAHEFIMRLP EGYDTIIGER 
GQNLSGGQKQ RLAIARAIVR NPTILILDEA TSSVDNATEL AIQRSLSKIG QGRTMILIAH 
RLSMVKHADK IFVLKKGSIA EQGTHEELLQ HDNVYANLWK LQMGETLTHP ELIID