Gene Aasi_1064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1064
Symbol
ID	6377165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	1376518
End bp	1377531
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	37%
IMG OID	642682177
Product	hypothetical protein
Protein accession	YP_001958138
Protein GI	189502421
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.732456
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATA TATTAGTAAC TGGCGGAGCA GGTTTTATAG GTGCTAATTT TATACCCTAT 
TTTTTAAACA AGTACCCAGA ATATGAAATA GTTAATCTAG ATAAGCTTAC GTATGCTGGC 
AACTTGAATA ATTTAACAGA AGTGCATTCA AATCCCCGTT ACCACTTCGT GCAAGGTGAT 
ATTACCAACA GAGAGTTAGT ATCATCTTTG TTTAGGCAAT TTGACTTTCA AGGAATTATT 
CACTTAGCAG CAGAGTCACA TGTAGACCGT TCTATTCAAG ATCCTACCTT ATTTATTAAA 
ACCAATATAG AAGGAACGTT TGTTCTGTTA GAGGCAGCCC GTCTGCATTG GATGCAAAAA 
CCTGGGGAAT ATAAACAAGA TTACATAGAA AGTCGCTTTT TACACGTATC TACAGATGAG 
GTATATGGTA GCTTAGGGCC TGCTGGTTTT TTTACAGAAG AAACCCCGTA TGCACCTAAC 
AATCCTTATA GTGCTACCAA AGCAGGCAGC GACCTGCTAG TGCGTAGCTA TGTACATACT 
TATGGGTTTA ATGCCATAAC TACCCATGCT TCCAACAATT ATGGTCCCAA ACAATACCCC 
GAGAAACTTA TTCCTATTAT TATTCAACGT GCGCTAGCAC AACAACCTAT TCCTATACAT 
GGCAAAGGAA ATGCTGTTAG AGATTGGATT TATGTACTAG ATCATTGTAA AGGTATTGAT 
TTAACCTTTC ATTATGGACA AATCGGAGAG CATTACAATT TTGGAGGTAA CCATGAGCAA 
AACAACCTAC AAATAGCTTA TCAGGTATGT GCTTTGCTAG ATAAACTAGC ACCACTGTCC 
AATAGAAGTT CTTATCAATC ACTCATTACT TTTGTAACAG ATAGGCCAGG CAATGATCAA 
CGGTATGCGT TAGCCACCCA AAAAGCTGAA AAAACTTTAG GCTGGAAAGC AGAAGAACCT 
TTTGAGACAG GATTGCAAAA AACTGTACAA TGGTACTTAA AAAATAAATT ATAA

Protein sequence

MKNILVTGGA GFIGANFIPY FLNKYPEYEI VNLDKLTYAG NLNNLTEVHS NPRYHFVQGD 
ITNRELVSSL FRQFDFQGII HLAAESHVDR SIQDPTLFIK TNIEGTFVLL EAARLHWMQK 
PGEYKQDYIE SRFLHVSTDE VYGSLGPAGF FTEETPYAPN NPYSATKAGS DLLVRSYVHT 
YGFNAITTHA SNNYGPKQYP EKLIPIIIQR ALAQQPIPIH GKGNAVRDWI YVLDHCKGID 
LTFHYGQIGE HYNFGGNHEQ NNLQIAYQVC ALLDKLAPLS NRSSYQSLIT FVTDRPGNDQ 
RYALATQKAE KTLGWKAEEP FETGLQKTVQ WYLKNKL