Gene Cmaq_1801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1801
Symbol
ID	5708824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	1877835
End bp	1878848
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	41%
IMG OID	641276310
Product	aminotransferase class I and II
Protein accession	YP_001541612
Protein GI	159042360
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0000372137
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.409693
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGATAG GGCACTTTAA ATGGTTAAGT GAACATAAGG TTGACTTAAA CATTGCCAGC 
AGCGGTATGA TACCGGTTAG TAGGAGTGAC GTGGAAAAGT TGGGTGAACC CACTGATATC 
ATGGAGGCTC TGAGCAACAT CTATAATGTA TCCACTAAGG CTATTGCGTT AACCCATGGT 
ACACAGGAGG GCAATTTCGC AGTCCTATCG GCAATTAAAG ATGCTGTGGA TCAGGTTATA 
ACAGTGGTGC CTGAGTATGA GCCGATTAGG GTTTTACCAA GTTTCCTTGG GCTTAGGCGA 
ATTGAGGTTA AGGTGAATCA CGGGTTAAGT GAATTAATCA ACTATATTAA ACCCAGGTCA 
GCTTTATTCT TCTCCAATCC AAATAATCCA CTGGGCATGC ACTTAAGTAG GGGTGAGATT 
AGGGATCTTG CTGATGAGGC TAGGAGGAAG GGCTCATACT TAATCATTGA TTCAATATTC 
CTTGAATTCG TCACAAGTGA TTTACGTGAC CTACCCCTGG AGAATACCGC ATACACCTTT 
AGTACCTCTA AATTCTACAC TGTTGATTCC TTTAAGGTTG GTTGGATTAT TGGTGATGAG 
GAGCTTATTC GAAGAGCCGT TAACGTAATT AACCTAGTAA GCCCCCTGGT TATTGGACTT 
GAGGCATCCT ACGTCTCCAT AATGCTCCAG AATAGGGATT GGTTTAGGAG AAGAAACCTA 
AGCATAATTT CACCTAATAG GGAATCATTA ATGAGTATTA GTGAATCATT AGGTAACTTA 
ATTAAGGTAA CTTACTTCAA TCACATGCCC ATAGCCTACG TAACCACTAA GTGCAATGTT 
GACAGTCTTG AATTAGCCAA TGAATTATTA AGAAGAGGAG TCTTAACTGT TCCAGGATTC 
TACTTCGGTA TTAATAATGG AATTAGGATT GGCTTAGGCT CAGTTAACCA CGACACATTC 
ACTAAGGCGC TTAACGTAAT GGTTAACGTG ATTACGGGCT TATGCACCAG GTAA

Protein sequence

MEIGHFKWLS EHKVDLNIAS SGMIPVSRSD VEKLGEPTDI MEALSNIYNV STKAIALTHG 
TQEGNFAVLS AIKDAVDQVI TVVPEYEPIR VLPSFLGLRR IEVKVNHGLS ELINYIKPRS 
ALFFSNPNNP LGMHLSRGEI RDLADEARRK GSYLIIDSIF LEFVTSDLRD LPLENTAYTF 
STSKFYTVDS FKVGWIIGDE ELIRRAVNVI NLVSPLVIGL EASYVSIMLQ NRDWFRRRNL 
SIISPNRESL MSISESLGNL IKVTYFNHMP IAYVTTKCNV DSLELANELL RRGVLTVPGF 
YFGINNGIRI GLGSVNHDTF TKALNVMVNV ITGLCTR