Gene Aasi_1014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1014
Symbol
ID	6377021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	-
Start bp	1317881
End bp	1320277
Gene Length	2397 bp
Protein Length	798 aa
Translation table	11
GC content	34%
IMG OID	642682134
Product	hypothetical protein
Protein accession	YP_001958095
Protein GI	189502378
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATACAAA ATATTTGCAA CTATTCTTAT CATCCTAATG ATTATGTACA TGGGCTACTT 
GCTAGTCATA TATACTATCC TAAACATAAA AAAGGAGATC AAGTAAAACT TCAAAGTATA 
TCTAAGCAAT TAGGGCATGA ATTACCGCCA AATCCTCAAA ATATTTGGGA AATAGTCCAA 
GTAGAAGATG ATACGGATGG GACAGGCTAT TGTAGTAATT TATATGTAAA TAAAAATATG 
CAACAAGCTG TACTATCATT CCAAGGTACT CAGGTTGAAA GCATTGTTAA AATACTAGAT 
AATAAAGATT TGAAAGAGGA CTTAGCGAGC ATACTGGCCA ATAAAATTAC AAAGCAGCAA 
GCACTTGCTT ATAAAGCAAC AAAAAATGCT GTTAATTATG CTAAGGGAAA AGGACTATCT 
TTATCTTTTA CAGGTCATTC CTTGGGTGGT TATTTAGCAG AGTTAGGAGT GGCATTCTGT 
TATCTCGATG CTGAACTTGA TTATAGAGAG GTTAAAGCAG TTGTATTTGA TAGTCCAGGA 
AGCGGAGAAA AAATAAACCT TCTTAAATCT AATAGTACGG AGTTTGATAT TCAAAAGTTG 
CCCATAGTTA CTTACCTTTC AGCACCTAAT ATTGTAAATT CATGTAATGG GCATCCAGGA 
GAAATCTGTA TAGTCCATCC AGAGCTAAAG TTAAAAGACT GGGCAATAAA ATATATAGAA 
GCGGTAAAAA GTTGGCCCTT GGTAGGTAAA AATATGGTTA GTATTGCCAA GTGTCTATTA 
TCACTTACAG GGCATAGTCT AAATACTATC CTTGCATCAT TTGATCCAAA AACAGGTAAG 
CCATTTAAAT ATATACGCAT AGGTGATTGG CCAAAGTTCG ACCTAAAAAG GCTAAATCAT 
AAATCTTATC TAGGCAATAA AGGAAGAGTA GGTGGGGCTA TAGTGTCAAA GCTTGCCCGG 
ATCATAAATA TTCCTATGGG TGGATTTATA GGCTTCCAAG CTGGAGCTTT TATAGAAAAT 
AAAATAGATG AACGCCTATG TCTTTTAAGT AGTATAATAG GATTTTTATT AGACTATAAA 
AAGATAGATG GAAAGCAGCT CTTGCAAACA TTAGAAGAAT TAGATGAAAA TTATAACAAG 
CCTGAAGATG AAACAGCTGA GAATGCTTTT AGACTCAAGT ATATAGGACA CTATAAAGAA 
AGCGGGTTAA AACTTAATCA ATATAAAGTA CATAAACATA AGAATAAAAG TGTTGATTGG 
TACCTGTATA AGTTAAGGAA GTATGCTAGA GATAAAAGTG TAATAGATAG GTTGAGTAAC 
GGAGATTTTA CCATACGGGT ATTACAAAAT ATTTTAAAAG ATTATGATAT TGTAACCATA 
TCTGAAAGCC AGTATATCGA ACTTAATACA GAACAAGGAG ATATAGAGGT GTTACGAGCT 
AAAATGCGTA GGAATTTAGA AATACTGACA GCTAAAGAGA TTGAGCATGC TATGCACAGT 
ATACGTACAC TCACAGCAAA AAGGTTATCA GTTCGACGTA AAGCTGATTC TTTTGCTCGT 
GTGAAGAACG GCCATGAGCA AGCAAAGCCT ACTCATGAAA TGAATAAAAT TGTAAATAAG 
TCTTTAAAAA GGCAAAACTT TTGTGATAGA CAAATAGACT ACCCACATAA GGAAGAAAAA 
CAATACGATT TAAAAAAAAT TATAATTCTA TCTATTTTTA TATTCTTCTT ATTATCATTA 
CCTATATTAG CTTATATATT TCACCTCACT CTTAGGCAGA ATCACGTAGA AAAATCTGAA 
AATGAATCTA TTATAGAACA TTGGCAAAAT CACAATTTAA CAGAAAACGT GCAAAATAAT 
TATAATGTCT TACAGGAAAT AGGAGGAAGT ACAGTTAATT CTAGTTATAA TAATGAGGAC 
GCTGAATGGG CAGCATCTAT TGTTCAAGAT ATAAGAGCAA AGCAACTAGA CACCGTTTAT 
TTGCATATTG CTGCAGATTT AACTCCTAAA AGAGCGGCGG TTCTTGGTAG AAATTTACAA 
GGAACACAAG TGCATACAGT TCGGTTAAAC CATATTGTAA ATGGAGATAA CATAATAACG 
GCTCTTGCTA AAAATCTGGA AGGAACGCAA GTACACACAA TTGTTATAGT ATCCAGTGAC 
ATAGGTTTTG GTTATATAAA TGATTTTTTC AATGTGAGAG CAGCAGAATT TGCTCAAAAC 
TTGCGAGGAA CTCAAGTACA CACAATTGCT ATAGTATCCA GTGACATAGG CAACAGATGG 
GCTATAGAAT TTGTTAAAAA TCTAGAAGGG ACCCAAGTAC ATACGGTTGA TTTCAGTGAT 
AGTATTATAA GTGATAAAGA GGAAGGCCGA TATCTAATTG AATGGGTTTT TGACTAG

Protein sequence

MIQNICNYSY HPNDYVHGLL ASHIYYPKHK KGDQVKLQSI SKQLGHELPP NPQNIWEIVQ 
VEDDTDGTGY CSNLYVNKNM QQAVLSFQGT QVESIVKILD NKDLKEDLAS ILANKITKQQ 
ALAYKATKNA VNYAKGKGLS LSFTGHSLGG YLAELGVAFC YLDAELDYRE VKAVVFDSPG 
SGEKINLLKS NSTEFDIQKL PIVTYLSAPN IVNSCNGHPG EICIVHPELK LKDWAIKYIE 
AVKSWPLVGK NMVSIAKCLL SLTGHSLNTI LASFDPKTGK PFKYIRIGDW PKFDLKRLNH 
KSYLGNKGRV GGAIVSKLAR IINIPMGGFI GFQAGAFIEN KIDERLCLLS SIIGFLLDYK 
KIDGKQLLQT LEELDENYNK PEDETAENAF RLKYIGHYKE SGLKLNQYKV HKHKNKSVDW 
YLYKLRKYAR DKSVIDRLSN GDFTIRVLQN ILKDYDIVTI SESQYIELNT EQGDIEVLRA 
KMRRNLEILT AKEIEHAMHS IRTLTAKRLS VRRKADSFAR VKNGHEQAKP THEMNKIVNK 
SLKRQNFCDR QIDYPHKEEK QYDLKKIIIL SIFIFFLLSL PILAYIFHLT LRQNHVEKSE 
NESIIEHWQN HNLTENVQNN YNVLQEIGGS TVNSSYNNED AEWAASIVQD IRAKQLDTVY 
LHIAADLTPK RAAVLGRNLQ GTQVHTVRLN HIVNGDNIIT ALAKNLEGTQ VHTIVIVSSD 
IGFGYINDFF NVRAAEFAQN LRGTQVHTIA IVSSDIGNRW AIEFVKNLEG TQVHTVDFSD 
SIISDKEEGR YLIEWVFD