Gene Aasi_0854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_0854
Symbol
ID	6377050
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	1084709
End bp	1086763
Gene Length	2055 bp
Protein Length	684 aa
Translation table	11
GC content	39%
IMG OID	642681992
Product	hypothetical protein
Protein accession	YP_001957953
Protein GI	189502236
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00109274
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAGGC ATTATACTAT AAATCTAAAA CTCATAGCCT ATATTTTACT TATCAGCTTA 
TGCTTACAAA GCTGTGGTGG GTTAAATAAT TCAATTATTC CTATAGAAGA AGAAAAAGAT 
CCACAAATAC AAACTGATAC CCAGCAACAA CTGATCCCAC ACACACAGAC GAGTATCCAG 
TCTTTAGTTG AACAAACAGT GACTGTTCAA GGAGGCAATG CCGTTACTTT TTACGAGTAT 
AAAGGAGAAT TGCAAGCCAG TGTAGAACCC TTATATGAGA AACATAAAGT CTACAATGGG 
ATACCTGTAT ACATAGAAAA AGGAATAAAA ATAGAAACCT TATTTTGTCT GGACAAGAAA 
ACACAAGAGC GACGTATACA TCTTCAAAAG GAAAAAGGAC GCCCGTCATA CGTTGCTATA 
TACGAGCCAT GGTTAATGGG TGGAGGCAAT ATATTAGGCT ATCAGACAGA AGGACTGCCT 
CAACAACTTC AAAAAGCTGA ACAGGGAGAT GCAAGAGCAC AATTTAACTT AGGAGTAATG 
TACTTCAATG GAGAAGGAGT AGAAAAAGAT GCAAGGAAAG CGGTAGAATG GTTTCAAAAA 
GCTGCTGAAC AGGGAGTTGC AGGGGCACAA TTTAACTTAG GACTAATGTA CTCTAAGGGA 
AAAGGAGTAG AAAAAGATGC AAGGAAAGCA GTAGAATGGT ATGAGAAAGC AGCGGAGCAA 
GGACATGCAG GGGCACAATT TAACTTAGGA CTAATGTACT CCAATGGAGA AGGAGTAGAG 
AAAGATGCAA GGAAAGAATT AGGATGGTAT GAGAAAGCAG CCAACCAAGG AAATGTAGAC 
GCACAATTTA ATTTAGGAGT AATGTATGCC AAGGGAGAAG GAGTAGAGAA AGATGCAAGG 
AAAGCAGTAG AATGGTATCA AAAAGCAGCC AACCAAGGAA ATGCAAGAGC ACAATTTAAT 
TTAGGAGTAA TGTATGCCAA GGGAGAAGGA GTAGAGAAAG ATGCAAGGAA AGCAGTAGAA 
TGGTATCAAA AAGCAGCCAA CCAAGGAAAT GCAAGAGCAC AATTTAACTT AGGAGTAATG 
TACTCCAAGG GAGAAGGAGT AGAGAAAGAT GCAAGGAAAG CAGTAGAATG GTATGAGAAA 
GCAGCCAACC AAGGAAATGT AGAGGCACAA TTTAATTTAG GAGTAATGTA TGCCAATGGA 
GAAGGAGTAG AGAAAGATGC AAGGAAAGCA GTAGAATGGT ATGAGAAAGC TGCTGAACAG 
GGAGATGCAA CTGCGCAATT TAACTTAGGA CTAATGTACT CTAAGGGAAA AGGAGTAGAA 
AAAGATGCAA GGAAAGCAGT AGAATGGTAT CAAAAAGCAG CCAACCAAGG AAATGCAAGA 
GCACAATTTA ACTTAGGAGT AATGTACTCC AATGGAGAAG GAGTAGAGAA AGATGCAAGG 
AAAGCAGTAG AATGGTATGA GAAAGCTGCT GAACAGGGAG ATGCAACTGC ACAATTTAAT 
TTAGGAGTAA TGTATTCCAA TGGAGAAGGA GTAGAGAAAG ATGCAAAAAA AGAATTAGAA 
TGGTATAAGA AAGCTGCTGA ACAGGGAGAT GCAACTGCAC AATTTAACTT AGGAGTAATG 
TACTCTAAAG GATTAGGAGT AGAGAAAGAT GCAAAAAAAG AATTAGAATG GTATAAGAAA 
GCTGCTGCAC AGGGAAACGC AAGTGCACAA TTTAATTTAG GAGTAAGATA TGGAGAAGGA 
TTAGGAGTAG AAAAAGATGC AAAAAAAGAA TTAGAATGGT ATGAGAAAGC TGCAGAGCAA 
GGACACGTGA AAGCACAACA TAATTTAGCA TGGATGTATG CAAATGGAGA AGGAACAGCC 
CAAAACTATA CTAAAGCAAT AGAATGGTAT GGGAAAGCCG CTGAAAAAGA AGATGCAGAT 
GCACAATTTA ATCTAGGGCA GATGTATGAG AAGGGAGAGG GAGTAGCTAA AGATTGTGCT 
AAAGCGGCAG AATGGTATCA AAAGGCTGCT GAAAAGGGAG ATTTAGATGC ACAAGAGAGG 
TTGAAAAATA TGTAG

Protein sequence

MKRHYTINLK LIAYILLISL CLQSCGGLNN SIIPIEEEKD PQIQTDTQQQ LIPHTQTSIQ 
SLVEQTVTVQ GGNAVTFYEY KGELQASVEP LYEKHKVYNG IPVYIEKGIK IETLFCLDKK 
TQERRIHLQK EKGRPSYVAI YEPWLMGGGN ILGYQTEGLP QQLQKAEQGD ARAQFNLGVM 
YFNGEGVEKD ARKAVEWFQK AAEQGVAGAQ FNLGLMYSKG KGVEKDARKA VEWYEKAAEQ 
GHAGAQFNLG LMYSNGEGVE KDARKELGWY EKAANQGNVD AQFNLGVMYA KGEGVEKDAR 
KAVEWYQKAA NQGNARAQFN LGVMYAKGEG VEKDARKAVE WYQKAANQGN ARAQFNLGVM 
YSKGEGVEKD ARKAVEWYEK AANQGNVEAQ FNLGVMYANG EGVEKDARKA VEWYEKAAEQ 
GDATAQFNLG LMYSKGKGVE KDARKAVEWY QKAANQGNAR AQFNLGVMYS NGEGVEKDAR 
KAVEWYEKAA EQGDATAQFN LGVMYSNGEG VEKDAKKELE WYKKAAEQGD ATAQFNLGVM 
YSKGLGVEKD AKKELEWYKK AAAQGNASAQ FNLGVRYGEG LGVEKDAKKE LEWYEKAAEQ 
GHVKAQHNLA WMYANGEGTA QNYTKAIEWY GKAAEKEDAD AQFNLGQMYE KGEGVAKDCA 
KAAEWYQKAA EKGDLDAQER LKNM