Gene Aasi_0120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_0120
Symbol
ID	6376550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	-
Start bp	139579
End bp	141204
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	33%
IMG OID	642681311
Product	hypothetical protein
Protein accession	YP_001957296
Protein GI	189501579
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGATTAA TTTTTAGTAA ACTATATACA ATTTCCTCAT CAAACATTAC TATAACACTT 
GGTATAGTCT TTTTATTCTT CATCAATGCT TGTGATTGTT CAAACCCTAA CCAGGGGCTC 
CCTACCTTAA TTAATGGCCC AAAGGATCAT AAGAAACCGA AGCAAGAAGC TGTTGTAATG 
AATGTTATAC CTAATAAGTT AAAGGCCGGT GAGAGAGAAG TAAAAATTAA TTTTACACTT 
TCAGATGGTT TTACGGAAGC TAGGCTCAAA AAATGTAGAT TAAAAATTAC TTATTATACA 
GCAACAGGTA TCAATAAAGA TAGTTACATA ACCTATAGAA ATGCTATGTC AATGGAAGTT 
CGAAAAGCAA GCCTAGATCA GGAGTTGAGC GAATTTTATC TTACATCAGT AGAACAACAT 
AAATCTTTTA GCCTACCAAT TATGCTTGTG CCAAATTTTA CGCCTGGCAT GGATGTCCTT 
GACCTAAAAG TAAATTTTGA GCTTCTTGAT GAAAAGCGAA AACCGTTACA AAAGGATCAA 
GTAAGCTGGG AATCGCAAGC AGAACCTCCT CATAAATTAA AGTTAGAACC CTACAAAGAA 
AATAAGCTAT TAGAACTAAA AGAATATAAA ATATTAGAAC TGGAAGAAAT AGAAATACAT 
GGAGAAAATA GAGAGTTTAC TGTGCAGGTG AGTAATTTGG GAAGCAATAT TACGGAATCT 
GATCAGTTAA AGTTAGCTAT AAGCAGGGTA GAAGGTAATC ATGCTAGCCT AAGTATAGAT 
GAGGAAAATA GCCAAGATCA AGAGCTAGAT TTAGGGACAA TAGCAGACAA TACACATATT 
TCTAAAAGAA TTACCATTTC TCCTGGGCAG GATGAAAAAG CTAAATTTTT GTTACAATTA 
TTATATAAAG GAAAAGAATA CGATTTTTTA TATATAGAGT GGAAAAAGGT ATCTCCTCAT 
ATTCGAGCTG AATATTATAG GAGAGATAAT CATATAGGAT ATTTTATTGA CAACTGTAGT 
TTATTACCAA AAAAGGTTCT AAAAGTATCT TATAAAAATA TAAGTAACAA TCCAGTTACA 
CTGGGTGGGG TTACAGAGAA ATTTATCTCA TTAGAAAACT TGAGGACTTT TGATCATGCT 
AGCTTGCCTA TAAAATTTAA TAATCAGCCA AGTGCAGAAT TTGAGTTTGA GTTGTTATAC 
ATGGATTCTG TACTATCAAC AGCGTCTATT GTAGTAGAAA ATCTTCAGCT AAAGATTATA 
GATCCACGGG ATGGTCAGAT GATATATGGT AGTAATCAGG CAACATTTTC TATTAAGAAT 
TTAAGCGGAG CACGTGTCAA TATAAAAAAA GTGTACATTC AATGTGCAAG TGAAAGGAAA 
AATGCTGCAA CTTTTATATT TGCAAATCCA GCTAATGGTG AGATAATTGA TGCAGAAACC 
CCAATTAGCT TGTCAAAGTA TATCCATAAA GAAACTTTAG AATCTGAAGA AAAAGTAGAA 
CTTCTCATAC AACTTAAAGA CACTCATTCT CAGATCGGTT CATCTGTTAA CTTGCAAATC 
CAAGAGCATT ATAATGAGAA GGTTACATTT TTGGATGAAA AGACCTTAAA TTGGGTGCAA 
AATTAA

Protein sequence

MRLIFSKLYT ISSSNITITL GIVFLFFINA CDCSNPNQGL PTLINGPKDH KKPKQEAVVM 
NVIPNKLKAG EREVKINFTL SDGFTEARLK KCRLKITYYT ATGINKDSYI TYRNAMSMEV 
RKASLDQELS EFYLTSVEQH KSFSLPIMLV PNFTPGMDVL DLKVNFELLD EKRKPLQKDQ 
VSWESQAEPP HKLKLEPYKE NKLLELKEYK ILELEEIEIH GENREFTVQV SNLGSNITES 
DQLKLAISRV EGNHASLSID EENSQDQELD LGTIADNTHI SKRITISPGQ DEKAKFLLQL 
LYKGKEYDFL YIEWKKVSPH IRAEYYRRDN HIGYFIDNCS LLPKKVLKVS YKNISNNPVT 
LGGVTEKFIS LENLRTFDHA SLPIKFNNQP SAEFEFELLY MDSVLSTASI VVENLQLKII 
DPRDGQMIYG SNQATFSIKN LSGARVNIKK VYIQCASERK NAATFIFANP ANGEIIDAET 
PISLSKYIHK ETLESEEKVE LLIQLKDTHS QIGSSVNLQI QEHYNEKVTF LDEKTLNWVQ 
N