Gene Aasi_0468 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_0468
Symbol
ID	6377719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	570287
End bp	571795
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	37%
IMG OID	642681628
Product	hypothetical protein
Protein accession	YP_001957607
Protein GI	189501890
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTTTA AATCACTACT AAGTAAGCCA TTAGCCACGT GGGTAGTACG TAATCAAAAG 
CAATGCTTCA AAAATCCAGT ACGTATCCAG CAGAATATTT TTCATAAGCT CATTCAGCAA 
GCTAAGCATA CGCTGTTTGG GCGTGCCCAT AACTTTAATT CTATTCGTAC GCATGAAGAT 
TTTAAGCAAT ATGTTCCTAT TAGGGCCTAT GAGGATTTTA CAGGGTATAT AGAGCAAATT 
AAAGGAGGGG AAAGCGACGT ATTATGGCCT GGAAGTCCTA TTTACTTTGC CAAAACGTCT 
GGAACTACAG GTGGAGACAA GCATATACCC ATTACCAAAG AGTCTATCAA ACATCATATT 
GTCAATGCTA GGAATGCCTT GCTATATTAT GTTAATGAGA CAAGCAAGAC TGACTTTTTG 
AAAAGGAAAA TGATTTTCTT ATCTGGTAGC CCGCAGCTAA CGACCGAAGC AAATATCCTT 
ACTGGTAGGC TATCGGGCAT TGTGAATCAT CATGTGCCTT CCTATCTACG TGGTAGTCAG 
CTTCCTAGTT ATGCTACTAA CTGTATACCA GATTGGGAAA CTAAGTTGGA TAAAATTGTG 
GAGGAAACGT TACAGGCTCA AATGGGGCTT ATATCTGGAA TACCACCTTG GGTACAAATG 
TATTTTGATA AACTTACACA AGAAACAGGT AAGCATATTA GTGAAATATT TCCAGATTTT 
TCCTTATTGG TACATGGTGG GGTAAATTTT GAACCCTATC GTCATAAGCT TTTTGACTCA 
ATAGGTAAAG CAGTAGATAC TATAGAAACT TACCCTGCTT CTGAAGGGTT TATTGCTTTC 
CAAGATTCCC AACAGGAAAA AGGACTCTTG TTACAATTAG ACAGTGGTAT GTTTTTTGAG 
TTTATCCCTA CTATCAGCTT AGCTTCTCCA ACTCCCAAAC GTTTATCTAT AGAGGAAGTA 
GAATTGGGTG TTGATTATGC TCTTGTCTTA TCTAGTAATG CAGGTTTATG GGCTTATATG 
CTAGGAGATA CTATTAAATT CATTTCCTTA GAACCTCCTA GAATTGTGGT GACAGGGCGT 
GTAAAACATT TTATATCTGC TTTTGGAGAG CATGTAATCA TAGAAGAGAT AGAGAAGGCT 
ATGCAATTTA CACTAAATAA GTATCCACAA GTTAGGGTAA CAGAGTTTAC AGTAGCGCCC 
TGGGTGAGTA AGCAAGCTGG TGAGGATTCT TATCATGAAT GGCTAATAGA ATTTAGTTAT 
CCTCCACAAA ATATAACTAC CTTTGCTTCT GAACTTAACC GACAAATGTG TTTGTTGAAT 
AGTTATTACA AAGACTTGAT AGAAGGCAAT ATTCTTAGTA CTTTAAAAGT AACTTCACTA 
CAATCAGGAG CTTTTAAAGA ATATATGCGG CAAGTGGGCA AGCTAGGAGA ACAGAATAAA 
ATAGTCCGCG TAGCAAATGA CAGAAAAATA GCAGATGCTG TTACTAAATA CAAAATATCT 
GATTTGTAA

Protein sequence

MNFKSLLSKP LATWVVRNQK QCFKNPVRIQ QNIFHKLIQQ AKHTLFGRAH NFNSIRTHED 
FKQYVPIRAY EDFTGYIEQI KGGESDVLWP GSPIYFAKTS GTTGGDKHIP ITKESIKHHI 
VNARNALLYY VNETSKTDFL KRKMIFLSGS PQLTTEANIL TGRLSGIVNH HVPSYLRGSQ 
LPSYATNCIP DWETKLDKIV EETLQAQMGL ISGIPPWVQM YFDKLTQETG KHISEIFPDF 
SLLVHGGVNF EPYRHKLFDS IGKAVDTIET YPASEGFIAF QDSQQEKGLL LQLDSGMFFE 
FIPTISLASP TPKRLSIEEV ELGVDYALVL SSNAGLWAYM LGDTIKFISL EPPRIVVTGR 
VKHFISAFGE HVIIEEIEKA MQFTLNKYPQ VRVTEFTVAP WVSKQAGEDS YHEWLIEFSY 
PPQNITTFAS ELNRQMCLLN SYYKDLIEGN ILSTLKVTSL QSGAFKEYMR QVGKLGEQNK 
IVRVANDRKI ADAVTKYKIS DL