Gene Rcas_1209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1209
Symbol
ID	5538675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	1562359
End bp	1563546
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	64%
IMG OID	640893341
Product	aminotransferase class I and II
Protein accession	YP_001431324
Protein GI	156741195
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGGCA GGCTTGCCCG CCGTGTGGCA GGGTTTGGCA CGACGATCTT CACCGAGATG 
AGCGCGCTGG CGCTGGAGCG CGGCGCGATC AATCTGGGGC AGGGATTCCC CGATTTTCCG 
GGTCCGTCAT TTGTGAAGGA AGCGGCAACC GCAGCCATTG GCGCCGACAT CAACCAGTAT 
GCGCCGATGC CCGGTCTGCC CCGCCTGCGG CAGGCGGTTG CCGCGCAGTG GGAATGCGAC 
TATGGCCGCG CAGTGGACTG GCAGCGCGAA GTGACGATCA CCAGCGGCGC GACGGAGGCG 
CTCTGCGATG CGATGCTGGC GCTCCTTGAT CCGGGGGATG GAGTCGTCAT CTTTGAGCCG 
GCGTATGACG CTTATGTGCC CGATATTACG CTGGCAGGCG GCACGCCGCT GCCGGTGCGC 
CTGTATCCGC CCGTCGCCGA TCATACGGCG TGGTGGTTCG ATCCGGTGGA ACTGCACGCC 
GCCTTCGCGC GCAAACCGAC GCTCATCATT CTCAACACGC CGCACAACCC GACCGGCAAA 
GTCTTTACCC GCACCGAATT GGAACTCATC GCCCATCTTT GTCAGGAGTA CAACACGATC 
GCCATTACCG ACGAAGTGTA CGACCGGTTG GTGTTCGACG GCGCGGCGCA TATTCCGCTG 
GCGACGCTCC CCGGCATGTG GGAGCGCACC TTGACGCTCA ACAGCGCTGG AAAGACCTTT 
AGCGTCACCG GCTGGAAGAT CGGCTACGCG GTCGGACCGG CGCATCTGAA CCATGCACTG 
CGTCAGGCGC ATCAGTGGGT GACGTTCGCC ACAGCATCGC CGTTGCAGGA AGCCATCGCC 
ACAGCGCTGG AACAGGCGTC GGTCAACGGC TACTACCGCG ACTTGCTGCG CGACTACGGC 
GAACGCCGGG CGCGACTGGA ACAGGCGCTC GAAACTGCCG GATTGCCGGT GCTGCCGGTG 
GAGGGCGCCT ATTTCATTTC TGCCGACATC AGCGCTACTG GCTGGACCGA CGACCGTGCC 
TTCTGTCGCT GGTTGACGAC CGACATTGGC GTTGCGGCGA TCCCGACGTC GGTGTTCTAC 
AGCGATCCGG CGAGTGCGCC GTGTTTGGCG CGTTTCTGTT TCGCCAAGCG GCTGGAGACC 
ATCGATGCCG CAGCAGAGCG CCTGGCGGCG CTGCGCACTC GTTGGTGA

Protein sequence

MSGRLARRVA GFGTTIFTEM SALALERGAI NLGQGFPDFP GPSFVKEAAT AAIGADINQY 
APMPGLPRLR QAVAAQWECD YGRAVDWQRE VTITSGATEA LCDAMLALLD PGDGVVIFEP 
AYDAYVPDIT LAGGTPLPVR LYPPVADHTA WWFDPVELHA AFARKPTLII LNTPHNPTGK 
VFTRTELELI AHLCQEYNTI AITDEVYDRL VFDGAAHIPL ATLPGMWERT LTLNSAGKTF 
SVTGWKIGYA VGPAHLNHAL RQAHQWVTFA TASPLQEAIA TALEQASVNG YYRDLLRDYG 
ERRARLEQAL ETAGLPVLPV EGAYFISADI SATGWTDDRA FCRWLTTDIG VAAIPTSVFY 
SDPASAPCLA RFCFAKRLET IDAAAERLAA LRTRW