Gene Aasi_0804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_0804
Symbol
ID	6376999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	1018660
End bp	1020141
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	35%
IMG OID	642681946
Product	hypothetical protein
Protein accession	YP_001957909
Protein GI	189502192
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.288732
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCAC TTAAAAAGTT GGCTAGTGAT ACAGCTATAT ATGGACTTAG CAGTATTATA 
GGTAGGGTGC TTAACTATCT GCTAGTACCA TTTTATACTA GCTTGCTTTT GCCTGCTGAA 
TATGGTATTG TTACCGAATT ATATGCGTAT GCTGCTTTTT TGAATATTAT TTATGGCTAT 
GGGATGGAAA CAGCCTATTT TAGGTTTGCT ACGCAAGGTT CTCCCATAGA GGTATTTAAA 
CTTACCAGTA GCTTGTTAAC TTTAAGTAGT CTATTATTTT CAAGCTTATT AGCATCTCTC 
GCTCCTCTCC TTAGTCGTTG GTTAGGCTAT TCAGGCCATG AACATTATGT TTACTACTTG 
GCAGCTATTT TGGCTGTTGA TACCATATTG TTGGTTCCTT TCGCACAGTT ACGTTTTTCT 
AACCAATCAT TTTTGTTTGC CCAAGCAAAA TGTTTACAAA TAGCCTTAAA TATAATTTTT 
AATCTTTTGT TGCTGTATAT ACTTCCAGGA ATCTATACAG GTAAGTTTTT GTACTCATTC 
AAGCCTTTCG TACAACTTAT CTATAATCCA GCCAACCATA TAGAATATAT TTTCTTAGCT 
AATTTAATGG CTAATTTATG CGTGTTACCT ATTTTGGGTA AGCCACTCAT CCATTTTAAA 
TTTAAAATAG ATTGGCAAAA GCTAAGGCCT ATGATTATAT ATGCTTTGCC TTTATTGGTT 
ATGGGGTTAG CTGGAACTAC CAACGAAATG CTGGCTAGGG CTTTGCTGAA GCATCTATTA 
CCATCCAATT TTTATTCCGG ACAGAGTAAG GAGGCAATAG TAGGTATTTT TGGAGCTTGC 
TATAAGCTTG CTGTCTTAAT GTCGCTAGCA ATCCAAGCCT TTCGTTATGC AGCTGAACCT 
TTTTTTTTCA CACATGCACA AGACAAGCGC TCTCCTCAGC TTTTTAGTAA AATTATGCAA 
GGATATGTAT TGGTCGCTTG CTTCATCTGG TTTGCTATTA GTGTTAACTT AGATATATTA 
GGTTATATAT TTCTTAGAAA CCCAGCATAT CGGGCAGGCA TTGAAATTGT TCCTTACCTT 
TGTCTAGCAT ACATATGGTT AGGCATCTAT TATAATCTTT CAGTGTGGTT TAAGCTAGCT 
AACAAAACAT ATTATGGTAG TGTCATAACT CTTATAGGAG CAGGTATTAC TATACTGTTG 
AATGTTTTAT TAGTACCTTA TTATGGGTAT TGGGGTAGTG TATGGGCAAC TGTAATCAGT 
TACCTAATTA TGGCTGTAAT TTGTTATTGT AAAGGACAGC AATACTACGC TGTTCCTTAT 
AAGACTGGTT ATGCACTATT TTTTATGCTA GTTACACTAC TTTTGATAAT AGTAATACGT 
CAAATACAGT ATGCTACTTG GGCTTATGCT TTGGTTAGTA ATATAGGGTT TACACTTGTA 
TTCGGGCTGG TTATATATAG AGCTATGCGC AGATCTTTAT AG

Protein sequence

MNALKKLASD TAIYGLSSII GRVLNYLLVP FYTSLLLPAE YGIVTELYAY AAFLNIIYGY 
GMETAYFRFA TQGSPIEVFK LTSSLLTLSS LLFSSLLASL APLLSRWLGY SGHEHYVYYL 
AAILAVDTIL LVPFAQLRFS NQSFLFAQAK CLQIALNIIF NLLLLYILPG IYTGKFLYSF 
KPFVQLIYNP ANHIEYIFLA NLMANLCVLP ILGKPLIHFK FKIDWQKLRP MIIYALPLLV 
MGLAGTTNEM LARALLKHLL PSNFYSGQSK EAIVGIFGAC YKLAVLMSLA IQAFRYAAEP 
FFFTHAQDKR SPQLFSKIMQ GYVLVACFIW FAISVNLDIL GYIFLRNPAY RAGIEIVPYL 
CLAYIWLGIY YNLSVWFKLA NKTYYGSVIT LIGAGITILL NVLLVPYYGY WGSVWATVIS 
YLIMAVICYC KGQQYYAVPY KTGYALFFML VTLLLIIVIR QIQYATWAYA LVSNIGFTLV 
FGLVIYRAMR RSL