Gene Aasi_1662 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1662
Symbol
ID	6376325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	872329
End bp	873981
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	41%
IMG OID
Product	hypothetical protein
Protein accession	YP_003573094
Protein GI	294661218
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATTG TTAAAGAGAA TGCTCCTATA GGTTTTAGTA GAACGCAGTA TTTGGATTTA 
TATCTAGCAC CTGGTTTTAC AACCAACCAG TTAAGTAAAC ATAGCCCTGA ATGGCAAGAG 
GCACATATAG GAGTAGTATT TCCTGAAAAA AGTTCAACTG GCAAAGGGTA TGTATATATA 
GGTGACGGGG GGCTGCTCGG TGGTGGGAAT AGTGGTTCCA AAGGAGGCGG TGGAAATGAT 
AGCGATAGGA CATCTAGCAG AAGTGAATCT AGTGAGAGGA GTACATCTGG CTCTAGCCAC 
AGTTCAAGTA GTAGCAGTGG TAGAGCAAGT CATAATATTG GAAGCTCACA TAGTAGTTTC 
AGTATGCCAA AAACTTCATC TTCCAGTTCC CATCATCGAG ATAGCTTTAA GGATTTTTGT 
AATAAGAGTT CAGCTAATGT TTCAGCTTCG TTATCTTCTG CAGGTATAAA GCATGATACC 
CATAGCACTT CCCATACTAG TGATAGTTTT AAGGATTTTT GTGATAAGAG TTCAGCTAAT 
GTCTCAGCTA TGTTATCTTC TGCAGGTATA AAGCATGATA CCCATAGCAC TTCCCATTCT 
AGCTTCTCCA GCCATACTAG TTCATATTCT AGCAGCAGGG CATCTAACCA AGCTGCTAGT 
AGCAGTAATA GTGAAAGTAA GCCTGCTGCT TCTAAGGAGT CATCCTCTTC AAGCAAAGAA 
TCTAAAGCCC CCCATCTTAC CCTAGAGAAT GCAGCTACGG AGGTGAGAAA GCACATACAA 
GAGGCTAAAA ATGATGGTCC TAAAGCTACG AGTGTATCAG CCAGCCAGCA ACAACAAGCA 
AAAGGGGAGC AACTACTTAA ACAGCTACGT GAAATCAAGC AACAACAGGA ACGGTCGTAT 
AGCCAAACAC AGACCGCTTA CATTACACCA GGTAATTCTG AAATAGGGAA TAAGCTGTTG 
TTAGACCAGC TAACCAAAAA AGGTCAAGAA TTGTCTACTT TAAAAGAATT AGAGTCAGAG 
CTAACACAAA GCTTAGAGCG CGAGCGTCCA ACTAGCCATT ATGAGGAAAC AAGAAAAGAA 
TCAATACTAG CTAGTGCTAC AACTACACCA AAAGAGATTA AGGTAAAAGA TAAAGGAAAA 
GAAAAGGATA CAAGCTTGAC ACCTGGTACT ACCCAAGCAA CAAATAACCT TCATAGTACA 
ACCCTATCTT CGTCTGGGGA CATTTCTACT GCTACAAGTA CTACTGAACC ACTACTCAGC 
ACACCCACTA AAGGTCCAGC AGTTAAAGTT GAGAGTGGTA CACGTAAGAC AAAAATACCC 
TACAATGATA GAGCGGACAG TTTTAGCTAT GACCACTACT CTTCAAGCAC TAGCACAAAT 
ACACCTGCTG TATCAGCTAC AGAGCCTACT AACCCGGCTA CATCTAGTAC TACTTCCACT 
AGTACTACTG ATAAAAGTGA AGCAGAAATT CATAACCAGT GGAGTGATTT GTTAAAGGAA 
ATACAAGTCC AATTGGGACA TTCCAAAATA CAAGGTTTAG CAGACGCTCT ATATCTACAA 
AAACAGGCTA GATTCTATAT AGAAAAATTA AAGTCGTATG AAAAATATAA ATGCATTAGC 
AGATCTTCCC TCGAGCAAGC ACTCACTCAA TGA

Protein sequence

MAIVKENAPI GFSRTQYLDL YLAPGFTTNQ LSKHSPEWQE AHIGVVFPEK SSTGKGYVYI 
GDGGLLGGGN SGSKGGGGND SDRTSSRSES SERSTSGSSH SSSSSSGRAS HNIGSSHSSF 
SMPKTSSSSS HHRDSFKDFC NKSSANVSAS LSSAGIKHDT HSTSHTSDSF KDFCDKSSAN 
VSAMLSSAGI KHDTHSTSHS SFSSHTSSYS SSRASNQAAS SSNSESKPAA SKESSSSSKE 
SKAPHLTLEN AATEVRKHIQ EAKNDGPKAT SVSASQQQQA KGEQLLKQLR EIKQQQERSY 
SQTQTAYITP GNSEIGNKLL LDQLTKKGQE LSTLKELESE LTQSLERERP TSHYEETRKE 
SILASATTTP KEIKVKDKGK EKDTSLTPGT TQATNNLHST TLSSSGDIST ATSTTEPLLS 
TPTKGPAVKV ESGTRKTKIP YNDRADSFSY DHYSSSTSTN TPAVSATEPT NPATSSTTST 
STTDKSEAEI HNQWSDLLKE IQVQLGHSKI QGLADALYLQ KQARFYIEKL KSYEKYKCIS 
RSSLEQALTQ