Gene Aasi_0044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_0044
Symbol
ID	6376717
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	60944
End bp	62335
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	35%
IMG OID	642681241
Product	hypothetical protein
Protein accession	YP_001957227
Protein GI	189501510
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACATA CTTACTCCTT ACATATAATA GTACGTATTT TAGTGCTATG CTTGTTTTTA 
CAAAACTGCT CAGGCTTTTC CAATGCACCA TTAAATAGCG AAAAAGAGTT TAACATACAG 
GATTTACTAG ATCAAGAATT TACAGCAGAT GGGGGGCATT TAGTTTCTTT TTACGAGGGG 
CAAGAAGAAA TTAAGGCAAC TGTACAAGTA AACCCCCTTG ATGAAAAAGA TAAAATTTAT 
AATGAAGTAA ATGTAGTTGT AGAAAAAGGG GTAGAGCTAG CGAGCTTAGC AAAGCTAGAT 
AGAAAAACAC AGCAAAAGCG TATACAAATT CAGTTCTCTA AAGAGCAAAA AGGCAAACCT 
CAAAGTGTCG TAATACATAA ACCTTGGTTG ATGGGTGGGA TGAAGGAGGT TATTATATTC 
TGTGGAAACC CAGGAGTTGG AAAAAGCTCT TTATGTAACT CTATTTTTCA AAGTTCAAAG 
CCAATATTTA ACTCCGGGGT ATCTATTTTA ACAGGAATGA CAACCAATAA ACAGCAATAT 
CTGCATGAAG GAAAGCTATA TGTCGACACA CCAGGTCTAG CAGATCCGGA AACTCGTACG 
AAAGCTGGCA AAGCAATAAC AGAGGCATTA AAACATAATG GCAATTACAA AATAGTCTTT 
GTTATAACTT TAGAGGGTGG AAGGCTAAGC CCTGAAGATG TGGCTACCAT TGAAACAGTC 
TGCGAAGCAA TTAAGGTTCC TTTTGAATAT GGTTTAATTT TCAACAAGGT TACTCCAGGA 
ATTAGGAAAA AAATAATAGG TATAGGAGTA GAATCATACG TAAAGAAGTA TAGTATAAGC 
TTAGATAATA ATATTAATAA CCTCACTGAA GAGTTCATCT TGAATCTTAT ACAACTTGGC 
TTATCAGAGG GTTACTTTAA AGCATTTACT AAACAACCAT CATCGGCAAC TATGCTTATG 
AGGGAAAGTC ACATGGAAGA CGAGGAAGGT GAGTATTTTA GTGCTAATAG TCCAAATATG 
AAGAATTTAT TAAATTTCCT TGGCAAGCTA AAGGCTACTG AAATACATGA ATCCAATATT 
ATTCCACTAG ATACTACGGA TTATAAGAAA AAGATCGAAG AACAAGAAGC AAAAAATAAG 
AAGCTAGAAG AAGAGCTTAA CAAAGTTAAA GAAGAAAATA GGAGACAAAT AAGAGATCTG 
GATGCACAAA TTAATAAATT AAACGAAGAA TTAGCTAAAA AAGGGGAAGG CTTTTGGAGT 
AAAGTTGGAA ATTTCTTAGG TGACGTTGGA ATTGCTATTG GAAGTGCTAT TGTGGGTGGT 
ATTGTAAAAA GTATTTTTCA TAGACCAGGC CCTACATGTA ATCCGGATCC TGGGGGGCAC 
ACAGAATTGT AA

Protein sequence

MKHTYSLHII VRILVLCLFL QNCSGFSNAP LNSEKEFNIQ DLLDQEFTAD GGHLVSFYEG 
QEEIKATVQV NPLDEKDKIY NEVNVVVEKG VELASLAKLD RKTQQKRIQI QFSKEQKGKP 
QSVVIHKPWL MGGMKEVIIF CGNPGVGKSS LCNSIFQSSK PIFNSGVSIL TGMTTNKQQY 
LHEGKLYVDT PGLADPETRT KAGKAITEAL KHNGNYKIVF VITLEGGRLS PEDVATIETV 
CEAIKVPFEY GLIFNKVTPG IRKKIIGIGV ESYVKKYSIS LDNNINNLTE EFILNLIQLG 
LSEGYFKAFT KQPSSATMLM RESHMEDEEG EYFSANSPNM KNLLNFLGKL KATEIHESNI 
IPLDTTDYKK KIEEQEAKNK KLEEELNKVK EENRRQIRDL DAQINKLNEE LAKKGEGFWS 
KVGNFLGDVG IAIGSAIVGG IVKSIFHRPG PTCNPDPGGH TEL