Gene Aasi_1069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1069
Symbol
ID	6376876
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	1381115
End bp	1382110
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	39%
IMG OID	642682182
Product	hypothetical protein
Protein accession	YP_001958143
Protein GI	189502426
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.857082
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCAAA TTAGAGTAGC CATTAACGGC TTTGGTAGAA TAGGCAGATT AAGCTTAAGA 
GCTTTATTAC AAAAATCAAA CATAGAAGTA ATAGCCATCA ATGATCTTAC GGATGCCTCT 
ACCCTAGCAC ACTTATTTAA ATATGATTCT AATTATGGAA GGTTTGCAGG CCATGTAACA 
GCGGATGCAA ACCATCTTCT TGTAAATAGC AAGAGAATTA CTGTATTAGC AGAACCTGAC 
CCTACCAAGC TACCATGGGA AAAGCTACAA ATAGATGTTG TATTAGAAGC TACTGGAAGA 
TTCTTAGATA AGGCTAGCAA TGAGCAGCAT ATAACTTCGG GTGCTAAACG TGTAGTTATT 
TCAGCACCGG CAAGCAATGA TATCCCTACT ATAGTGTTAG GAGTTAATGA GAATATTTTA 
TCTACGGCTG GTCCTATCAT TTCAAATGCT TCTTGTACAA CAAATTGTTT AGCACCTGTG 
GCATACGTAC TAGATAAGTA TTTTGGTATT GAAAAAGGTT ATATTAATAC CATTCACGCT 
TATACGGCCG ACCAACGTTT ACAAGATGCG CCCCATAAAG ATTTACGGCG TGCTAGGGCA 
GCTGCAAAAT CTATTATCCC TACTACTACA GGAGCTGCAA AATCTATAGG TACTGTTTTA 
CCACAGCTTC AAGGGAAATT AGATGGTATT GCTATGCGTG TACCTGTCGC AGATGGCTCT 
ATATTGGACT TAACAGCTAT TCTTCGGCAG CCAGTTACCA AGAAAATGAT TAATACTGCC 
ATGAAGCAAG CTGCTGATGG AGCTATGCAA GGCATACTTG AATATACAGA AGATCCTATT 
GTTTCTGTAG ATGTGATTGG CAATCCACAC TCCTGTATTT TTGATGCGCA GCTTACTTAT 
ACACAAGGGA ACCTAGTAAA GGTAGTAGGT TGGTATGACA ATGAAGGCGG CTATGCACAT 
CGTATAGCAG ATTTAATAAG TAAGCTCGGC AGATAA

Protein sequence

MEQIRVAING FGRIGRLSLR ALLQKSNIEV IAINDLTDAS TLAHLFKYDS NYGRFAGHVT 
ADANHLLVNS KRITVLAEPD PTKLPWEKLQ IDVVLEATGR FLDKASNEQH ITSGAKRVVI 
SAPASNDIPT IVLGVNENIL STAGPIISNA SCTTNCLAPV AYVLDKYFGI EKGYINTIHA 
YTADQRLQDA PHKDLRRARA AAKSIIPTTT GAAKSIGTVL PQLQGKLDGI AMRVPVADGS 
ILDLTAILRQ PVTKKMINTA MKQAADGAMQ GILEYTEDPI VSVDVIGNPH SCIFDAQLTY 
TQGNLVKVVG WYDNEGGYAH RIADLISKLG R