Gene Aasi_1118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1118
Symbol
ID	6376799
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	1433971
End bp	1434960
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	35%
IMG OID	642682228
Product	hypothetical protein
Protein accession	YP_001958188
Protein GI	189502471
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.420783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAAGT TAGCAGGCTA TTATAAAAAT CAAGGACAAG AATCTCGAGC AACTATAATG 
GATAGTATGT CAAAAGATAA AGAAGTTACT GGATCTGCCG AGTGGCACTT AGGTAAGCTG 
TATGAAAATG GTTGGGGGAT AACTAAAGAT TGTAAAAAAG CTATAGCATG GTATCAAAGC 
GCGAGTTATC AAAATCATAC GGAAGCACAA TGTAGGCTTG GTAGGATTTA TGAGAATGGT 
ATAATAAATG GTATGATAAC AGAGAAAGAT GAACAAGAAG CGAGAGACTG GTATGAAAAA 
GCTGCTGAAA GGGGAAGTTC AGTAGCAAGG AATGCATTAT GTTCTATGTA TGAAAAGGCT 
GTAAGAGTAA GACAAGAAGA TATGGAAGCA CAATATAACC TAGGAGTAAT GTATTACAAG 
TGCTGGGGAG TAGATAAAAA TTATCAAGAA GCTAAAGAAT GGTATGAAAA AGCTGCGGAG 
CAAGGATACG CGAAAGCACA ACATACTTTA GCAGCAATGT ATATAAATGG AGAAGGAGTA 
GAAAAGGACC ATGTTAAAGC ATTTAAATGG TGTCAAAAAG CTGCGAAGCA AGGATACGCA 
AGAGCACAAC ATAATTTAGC AGCAATGTAT ATAAATGGAG AAGGAGTAGA AAAGGACCAT 
GCTAAAGCAT TTAAATGGTG TCAAAAAGCT GCGAAGCAAG GATACGCAAA AGCACAAGAT 
AATTTAGCAG CAATGTATAT AAATGGAGAA GGAGTAGAAA AGGACCATGC TAAAGCATTT 
AAATGGTGTC AAAAAGCTGC GGAGCAGGGT AATGTAAGTG CACAATACAA TAGAGCCGCT 
GCGAAACAGA AAATTAATAA AACTATTGGA TTTTTGAGAG ATAAATTTAC TATCTACAAA 
AAATCAACCT GCCTTTTTTA TACTTTAAAT GCCTATTTTT ATTTTTTGTG TTCTCTAAAT 
TGTGAAAAAT ACTCCTCTGT TTTTTTATAA

Protein sequence

MSKLAGYYKN QGQESRATIM DSMSKDKEVT GSAEWHLGKL YENGWGITKD CKKAIAWYQS 
ASYQNHTEAQ CRLGRIYENG IINGMITEKD EQEARDWYEK AAERGSSVAR NALCSMYEKA 
VRVRQEDMEA QYNLGVMYYK CWGVDKNYQE AKEWYEKAAE QGYAKAQHTL AAMYINGEGV 
EKDHVKAFKW CQKAAKQGYA RAQHNLAAMY INGEGVEKDH AKAFKWCQKA AKQGYAKAQD 
NLAAMYINGE GVEKDHAKAF KWCQKAAEQG NVSAQYNRAA AKQKINKTIG FLRDKFTIYK 
KSTCLFYTLN AYFYFLCSLN CEKYSSVFL