Gene Aasi_1079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1079
Symbol
ID	6377383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	1389821
End bp	1390954
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	44%
IMG OID	642682192
Product	hypothetical protein
Protein accession	YP_001958153
Protein GI	189502436
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.951143
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTATTA GCAAGCTGGT TATAAAAGCA TATAGTAATG AGAGCTTTAC TACCCAAAAG 
GGTGAGTTTT CAGCTTCTAT CAACCCTGCA AACCTCAAAA TTACAAGTAG TGTAGATTAT 
GAGAGGTCTC AAGGTATGGG CTCAGCCAAT ATGGCGCTTC GCTATAACGT TTCGCCTCCT 
AAGGAACTGT CGTTTAGACT CATCTTTGAT AATACAGGGA TCTTTCCAGA CTCAGACAAA 
AGTGTAAAAG ATCAGCTAGA AGCTTTGCAA GACGTGGTAT ATAAGTTCCA GGAAGATATT 
AATTCACCTT ATTACGTGCG GGTTATCTGG GGTGTAATTG ATTTTAAAGG TAAATTGGTT 
GGTTTGGAGA CAAGTTATAC CATGTTTAAG TCAGATGGTG CTCCAATCCG AGCAGAAGTA 
GATATAGTGG TATTAGAAGA TGCAAGCGCA AGCAAGATTG CCACAGCTGC AAAAGCAGCT 
GCGAAAACGG CTAATACAGC CACTACTGCA GTATTAGGGG CAGCAACTGG TGCAGCGGCT 
GGGGCCGCAG CCGCTGCCGT AACCGTAGCA GCAGCGTCGG TTGCTGTAAG CCCTAATGCA 
CCACCTAGTG TAGCGCCTGA TGCTACAACT GCTGGAGCTA CACTCACAGA ATCAGAACTT 
GCTGACGCCA GCACACCAGA CACTGCAGGA GCAAAAGCAA ACACTAGTGC AACTGGCACT 
TCACAAGCAG GAGGAGAACC AGCAGCAGGA ACAAATGCCG CAGCCACCAC TACCAATCCT 
CAAAATGCAG ATACAAAGAA TATAGAGCAG GCACCTGGCG CAACTGCAGC TGCTACCCCT 
ACTACGGTAC AACAAGTGAC ACCCAAAGAT AAATTAACTG GTGTTGCTAA AAATTCATTA 
GGAGATCCAA ATCTTGCTAA ATCACTAGGC CGTGTAAATG GATTAGACAG CCTTAGGAAC 
TTAGCTTCAG GGCTCTCACT AGCTGTTCCT TTAACATCGC TGGGGCTTTT AGCAATGCTA 
TTGGCAATGG CAAAAAAATA CGGTTCAAAG GGTGCTAATT ATTTAAAAAG TAAGGCAAAA 
ACAGGTAAAA ACAAGGCTGT TGCAGCTAAA GATAAGGTAA AGAGTAAACT TTAA

Protein sequence

MSISKLVIKA YSNESFTTQK GEFSASINPA NLKITSSVDY ERSQGMGSAN MALRYNVSPP 
KELSFRLIFD NTGIFPDSDK SVKDQLEALQ DVVYKFQEDI NSPYYVRVIW GVIDFKGKLV 
GLETSYTMFK SDGAPIRAEV DIVVLEDASA SKIATAAKAA AKTANTATTA VLGAATGAAA 
GAAAAAVTVA AASVAVSPNA PPSVAPDATT AGATLTESEL ADASTPDTAG AKANTSATGT 
SQAGGEPAAG TNAAATTTNP QNADTKNIEQ APGATAAATP TTVQQVTPKD KLTGVAKNSL 
GDPNLAKSLG RVNGLDSLRN LASGLSLAVP LTSLGLLAML LAMAKKYGSK GANYLKSKAK 
TGKNKAVAAK DKVKSKL