Gene Aasi_0861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_0861
Symbol
ID	6377122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	-
Start bp	1096513
End bp	1098018
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	37%
IMG OID	642681998
Product	hypothetical protein
Protein accession	YP_001957959
Protein GI	189502242
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2317] Zn-dependent carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.157746
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGATA GAACAAACAA TTACTTAAAA CTTGAAAATA GGTTAAAACA AATTACCCAC 
TTAAAGAATA TTGCTTCACT TGCTCATTGG GATGCAGAAA TTAATCTACC TACAGCTTCT 
ACAGCCAACC GACATCAAGA ACTAGCGACG CTAGCAGAAA TTATTCACCA AATGTCGGTT 
GCCAAAGAAT TAGGTGATTT AATTGAAGCC GCAACTCAAG AAGTGAGCGA GCTTAATGAG 
TGGCAAAAGG CTAACCTGGC ACTCATTAGA AGAACTTATG AGCATGCACA ATGCATTAGC 
CCTAAGTTAC AACACTCATA TACTATGGCT ATTAGTGAGT GTGAATATAT TTGGCGAGAT 
GCACGCAAAA ACAGTAATTT CAAACAGCTG GTTCCACACT TAAACCAAGT TTTTGAGATT 
TCCCGCACTA TAGCAGATTG TAAAGCTAAG CACTTCCAAA AAGATCCTTA TGACATGCTC 
ATGGATACTT ATGAAGCAGA TAGCAGCGCA AAAGAAATTC AGGAAGTATT TGATGTACTT 
AAGCGCGAAT TACCTAAGCT TATTGAGAAG ATTACAGCTA AACAACAAAA TGAAAAAATC 
ATCCCACTTT CTGAGAAAAT AGATATAAAT ACACAAAAAG CTATTGGCTT GCACATTATG 
GAAAGGATGG GATTTGATAT GGATAAAGGA CGTTTAGATA TTTCTGCACA TCCTTTTTGT 
AGTGGCTCCA ATGATGACGT AAGGCTTACC ACTCGCTATA ATGAAAATAA TTTTATAACA 
GGTTTATTTG GTATTATACA TGAGGCAGGG CATGGTTTAT ATCAGCAGAA TCTTCCAGAA 
GCATATAGAA ACCAGCCAGT TGGCCATTAT AAAGGTATGG CTTTTCATGA AAGCCAATCT 
TTAATTATGG AATGCCAAGC AGGCACCTCT TTAGAATTTA TACAGTACTT AGCAAAGCTT 
TTACATGATA ATTTTGGGTT AAAAAGCCCT GCCTATTCTG CAGAAAACTT ATATAAACTA 
GTAACCAGGG TCCAGCCTAG CTTTATTCGT GTAGATGCCG ATGAGGCCAC TTATCCTTTA 
CATGTCATAC TGCGATTTGA AATTGAACAA GCCATCATTA AAGATAGAGT GCAAGCAGAG 
GATCTGCCAA ACTTATGGAA CACTAAAATG CAGGAGTACT TGGGTATTGT TCCTGCTAAC 
GATAGAGAAG GATGTATGCA AGATGTACAC TGGTCAGCTG GCTTATTAGG TTACTTTTCT 
TGCTATACTA ATGGGGCGAT TATTGCTAGT ATGCTCATGA AGGCTGCACA AGAAAAGTAC 
CCTGCTATTA AAAGCCAATT AAGCGAGGGT AATTTCCAGA ATTTAAATAA CTATCTCAAT 
CAGCACTTAA GAAATTTAGG TTCTCTAAAA GGTTCTACTG AATTACTTAA AACTGCAACA 
GGATTTGAAA AAATCAATCC TAATATTTTC TTAGAATACT TAACCAATAA GTATTTGGCA 
TCATAG

Protein sequence

MSDRTNNYLK LENRLKQITH LKNIASLAHW DAEINLPTAS TANRHQELAT LAEIIHQMSV 
AKELGDLIEA ATQEVSELNE WQKANLALIR RTYEHAQCIS PKLQHSYTMA ISECEYIWRD 
ARKNSNFKQL VPHLNQVFEI SRTIADCKAK HFQKDPYDML MDTYEADSSA KEIQEVFDVL 
KRELPKLIEK ITAKQQNEKI IPLSEKIDIN TQKAIGLHIM ERMGFDMDKG RLDISAHPFC 
SGSNDDVRLT TRYNENNFIT GLFGIIHEAG HGLYQQNLPE AYRNQPVGHY KGMAFHESQS 
LIMECQAGTS LEFIQYLAKL LHDNFGLKSP AYSAENLYKL VTRVQPSFIR VDADEATYPL 
HVILRFEIEQ AIIKDRVQAE DLPNLWNTKM QEYLGIVPAN DREGCMQDVH WSAGLLGYFS 
CYTNGAIIAS MLMKAAQEKY PAIKSQLSEG NFQNLNNYLN QHLRNLGSLK GSTELLKTAT 
GFEKINPNIF LEYLTNKYLA S