Gene Aasi_1023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1023
Symbol
ID	6376868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	-
Start bp	1329239
End bp	1330873
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	34%
IMG OID	642682139
Product	hypothetical protein
Protein accession	YP_001958100
Protein GI	189502383
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGAAAT ATAAAAGGAT ATTACCTGAC AAAAATTTTA TATTAGGTAT GTGTGCAGGG 
ATAGGGCTGT GCTTATATAT AGGCTTATAT TTTTTTCAAA ATTCTTTCAA ACAGCCTGTT 
CGTAAATTCG GCGAAGTATT AAACTATATT CAAAAATACC ATATAGATAC CATAGATAAT 
GCTAAACTGG TAGAACTTAC AGAGGCAGCG CTCTCAAAGT TAGCTAAGCA GTTAGATCCA 
CATACCACTT ATATTGATGC ACAACAGAAT GCAGTAAGTA GAAATCATTT AAAGAGCCAA 
ATTGAAGGGA TAGGTATTGA GTTTGTTTTA TTAAAAGATG TAGTGTATGT ATTACATGTT 
ATTCCTAAAG GGCCTGCAGA CCAAGCAGGC TTACAAGTAG GGGATAAGGT TGTTAAAATA 
GATGGGCATA TTTTAAAAGA AGCAAATTTT AATTCAAATG ATATAGTATT AAAAATGAGA 
GGCCCTAAAG GAACTCCAGT AAAAGTCTAT ATATGCCGGA ACAACACAAA AGATCTAATT 
GAAATTACCA TCATAAGAGA TCAAATTTCT ATACCGTCCA TCGATGCAGG CTACATGGTA 
GATAGCCAAA CAGGCTACAT TAAGTTAAGT CAATTTGCAA GCAAAACTTA CCAAGAATTT 
ATAGAAAGGA CAAATCAGCT ATCAGAACAG GGAATGAAGA AGTTACTGCT TGACTTACGA 
GATAATTCAG GAGGTTATTT CGAGACAGCC TTAAATATGG CTGAAGAAAT GCTAGAACCA 
GGAAAGTTGA TAGTATATAC AAAAGGTAAA TACAAAGGCT TTGATACAAA ATACTATGCA 
AATGGGAAAA ATAGGCTTGG TAAGCTACCC ATCATTATTT TGATCAATGA GAATACTGCT 
TCTGCTTCAG AACTGTTAGC AGGTGCTTTA CAAGACCATG ATAGAGCACT TATTGTAGGT 
AGAAGGTCTT TTGGTAAAGG GCTAGTACAA TGGCCTATTG AGTTTAAAGA TAGCTCTGTA 
TTGAGTTTGA CTGTAGAAAG CTACTTTACA CCAAGCGGAA GGTCTGTACA AAAGCCCTAT 
GATAAAAGAA TAAACTATGA ATTAGACTTA TATAATAGAT ATAAGCAAGG CGAGTATTTT 
CATGCAGATA GCATACAGCT TGACAAAACT ATAGCATATC AAACTTCAGC AGGAAGAACA 
GTGTATGGAG GCGGGGGAAT TATGCCTGAT CATTTTATAC CGATAGATAC TACGGCGCAT 
AGTGACTATG TTAACGAGCT AGTAGATAAC TACATTATAC AACAGTATGC TATAACATAT 
GCACGCTCTA ATAAACAGAA ACTGGAAAAG TTGAGATTAG AGGATTATCT TAAAATTTTT 
TGCGTAACTG AAGAAATGGT TGGTCAACTT GTTGAGGAAG CTAAAAAGGC AGCAATCAAG 
CAAGTATTTA TAACCGATCC AATAAAAATC TCTATTAAAA ATTTGCTTAA AGCATATATT 
GCCAAAACAT TATGGCAATA TCAAGGATTT TATAGTGTAT ACAATAAAAC AGATACAACT 
ATTCTAAAAT CCTTACAACT ATTTAACCAA GCAGAAGCAT TACTGCAAGA AGATATAACT 
TACATAGCAG GCTAG

Protein sequence

MWKYKRILPD KNFILGMCAG IGLCLYIGLY FFQNSFKQPV RKFGEVLNYI QKYHIDTIDN 
AKLVELTEAA LSKLAKQLDP HTTYIDAQQN AVSRNHLKSQ IEGIGIEFVL LKDVVYVLHV 
IPKGPADQAG LQVGDKVVKI DGHILKEANF NSNDIVLKMR GPKGTPVKVY ICRNNTKDLI 
EITIIRDQIS IPSIDAGYMV DSQTGYIKLS QFASKTYQEF IERTNQLSEQ GMKKLLLDLR 
DNSGGYFETA LNMAEEMLEP GKLIVYTKGK YKGFDTKYYA NGKNRLGKLP IIILINENTA 
SASELLAGAL QDHDRALIVG RRSFGKGLVQ WPIEFKDSSV LSLTVESYFT PSGRSVQKPY 
DKRINYELDL YNRYKQGEYF HADSIQLDKT IAYQTSAGRT VYGGGGIMPD HFIPIDTTAH 
SDYVNELVDN YIIQQYAITY ARSNKQKLEK LRLEDYLKIF CVTEEMVGQL VEEAKKAAIK 
QVFITDPIKI SIKNLLKAYI AKTLWQYQGF YSVYNKTDTT ILKSLQLFNQ AEALLQEDIT 
YIAG