Gene Aasi_0312 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_0312
Symbol
ID	6377606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	360384
End bp	362342
Gene Length	1959 bp
Protein Length	652 aa
Translation table	11
GC content	38%
IMG OID	642681491
Product	hypothetical protein
Protein accession	YP_001957476
Protein GI	189501759
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACAGCA CAAATAAAAG AATTACAGCA GCTATTTTAC TTTGTAGTCA GCTATTAACC 
ATAACAAGTT GTAGTAATTA TCCTAATATA CCCACCCAAC CTAAAGTAGC TCGTACGGAA 
AAGAGAATTG ATAAAAAACC AAGCAAAGAT GACTCAATAT TACCCTTGGT AGATAGCTTA 
GTGATTACTA TTGCTGATGG GAAAAAACTT AATTTAAAGT ATGAGAACAA AAATTGGCAA 
GCAGCGTTAA TTACAGAAGA TGGTGTGGAA CAGATATTGA CCATTGTATT AGAGCCAGGC 
TATAGCATAG CTAAGCTAAT TACTGCTAAA GAAGAGGAAC AGCGAGAGCT AGTGCGCCTA 
GTAGCCAGTA AAAAAGAGAC ATTAAATGCA GCATATGTAT ATATAGGCAA ACAAGCTTGT 
ACAGAGCAGT CTATAACTAG CCAGGTGCAG ACAAAAAGCA GCACAAAATT ATCGGATGAT 
GCATCAGCTT CTTCCAGAAT GCTAATTACT AGTACAGCAC ATACAAAAAT ACCTATCTCT 
ACATTATCCA AGCATATAAA AGAAGAGCAA AAGCTAGCTT CCAAACAAGG TAATTCTATT 
ATAGTAAACT CTATAGTGGA CAATACCAAG CAGGCCATAA AGAGAGCTTC ATCAGTATCT 
GTATTACGTA ATCAAGTTTT TATCTTATCT ATATCTATTA AACCAACGTA TAAGGGGCAG 
CAACCTAAGA ATAATAGTCC TTCCATTACT TTAATCAGAG GCAAAGCTTT GGAATTGCAC 
AAAAAAGAGG CACAAGATAA GCGAGAACAA GCCAAGCTAT ATAATGAAGT AGATATAGCT 
GCATCAATAA CTGACAGTAA TGGCATAGCT GCACAGTTAA TAGAAGAGCA GGCTATCCCA 
AGCTATATAG CAAAAGGAGG CCATCAAGTA TATCCATCCT TTATAGAAGG CAAATGGATG 
GCAGTTGTTA GGGAGCATGC TCCTTTAGGT TTTAGTAGAA CGCACTATTT GGAACTGTAC 
CTAGCACCTG GCTTTACAGT CAATGAATTA AGCAAACATA GTTTGAAGTG GCAGGAAAAA 
CATATAGCAG TAGTATTTGC TGAGCACAGC AAAAGTGGTA AAGGATATGT ATATATAGGT 
GAGAAAGGAC TGTTGGGGGG AGGAAATAGT GGGTCTAAAG GAGGTGGTGG AAATGATAAC 
GATCGCTCCT CTGGAGGTAG TAGTAGTTCA AGTGGAAGCA GCAGAAAAAA TGTGTCTAGC 
GGAAGTAGAA AATCCTCTTC TAGTTCTAGT GGAAGTACAA GACATGATAA ACAGAGTAGC 
CAAAGCACTA GCAGGTCAAG CACTTCCTCT TCAAGCACTT ATAGTAGTAG TTTTACTCCT 
AGTACAGAGC AACGTGCTAC ATCGGCTATG TTATCTTCTA TAGGTATCAA ATCTGAACTA 
CCTACTTATC ATTTTGATAA GTCATATACT AATGATTATT CTTATAGTAC TCCACATGTT 
AGTTACCCCA ATCGAGATAC CTCATATTCG GGCAGTGTTA TGGACAGCAT TAGTAGCAGC 
AGAATATCCA CGGTTAGTAC ACCAACCCCC ATAATTTCTT ATAGAACGTC TACTAGTATG 
GGAGATATAC CAAGTAGTAG TCATACAAGA GAACCTTCTG CTAATAGAAC AACTCCTAGT 
AGTAGTATAA CAGGAACTGC TGCTTACATG AAGGCACCAA GTGAGAAAGG GCTACCCCTT 
ACGCTAAAGG ATACAGCTAA AGAGATAAAA AGCTATTTGC AAGAAGTTCA AGGTAGTGGG 
CAAAAAGACA TTGATTCAAT AATTAAGCAG CGGGAAAAAG GAGAGCAATT GTTAAGACGG 
CTACATACAC TTAAGCAACA ACAAGAGAGA GCGCATGCGT ATACAGAAAA AGCATATATT 
ACAGCAGATA ATTCTGGGAT AGGCGATCAG AAACTCTAA

Protein sequence

MYSTNKRITA AILLCSQLLT ITSCSNYPNI PTQPKVARTE KRIDKKPSKD DSILPLVDSL 
VITIADGKKL NLKYENKNWQ AALITEDGVE QILTIVLEPG YSIAKLITAK EEEQRELVRL 
VASKKETLNA AYVYIGKQAC TEQSITSQVQ TKSSTKLSDD ASASSRMLIT STAHTKIPIS 
TLSKHIKEEQ KLASKQGNSI IVNSIVDNTK QAIKRASSVS VLRNQVFILS ISIKPTYKGQ 
QPKNNSPSIT LIRGKALELH KKEAQDKREQ AKLYNEVDIA ASITDSNGIA AQLIEEQAIP 
SYIAKGGHQV YPSFIEGKWM AVVREHAPLG FSRTHYLELY LAPGFTVNEL SKHSLKWQEK 
HIAVVFAEHS KSGKGYVYIG EKGLLGGGNS GSKGGGGNDN DRSSGGSSSS SGSSRKNVSS 
GSRKSSSSSS GSTRHDKQSS QSTSRSSTSS SSTYSSSFTP STEQRATSAM LSSIGIKSEL 
PTYHFDKSYT NDYSYSTPHV SYPNRDTSYS GSVMDSISSS RISTVSTPTP IISYRTSTSM 
GDIPSSSHTR EPSANRTTPS SSITGTAAYM KAPSEKGLPL TLKDTAKEIK SYLQEVQGSG 
QKDIDSIIKQ REKGEQLLRR LHTLKQQQER AHAYTEKAYI TADNSGIGDQ KL