Gene Dret_1447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1447
Symbol
ID	8419276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1678266
End bp	1679372
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	57%
IMG OID	645038022
Product	aminotransferase class I and II
Protein accession	YP_003198312
Protein GI	258405570
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0268591
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.142096
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGATTGC AGCCTTTCAA ATTGGAACGG TATTTTGCCA AATACGAATT CAATGTCCGC 
CATCTATTGA GTTCTTCGGA TTGCGAGTCC ATGACCGTGG CGGACTTGCT GGACCTGGAG 
CCCGGCGCTG CAGAGCGTTT TCACAATGTC TGGCTCGGCT ATACCGAATC CGAGGGCAGT 
CCAACTCTGC GCGAGACGAT CGCTTCCATG TACAATGCGC AGCAGGCCGA CGACATTCTG 
GTCCACAGCG GTGCGGAGGA AGCGATTTTT TTGTTCATGA ACGCGGTCCT GGAAGCCGGG 
GACCACGTCG TTGTCCACTG GCCGTGCTAC CAATCCCTGA CTGAAGTGCC GCGGTCCATC 
GGCTGCGAGG TCGATCTCTG GAAAGCGCGG GAAGAGGCGC AGTGGGGCTT GGATCTCGAG 
GAATTGGACG AACTGCTCAA GCCGAACACC AAAGCCATTA TCGTCAATCT TCCGCATAAT 
CCCACAGGAT ATCTCATGGA GCCCGAAACG TTTTCGCGGC TTTGCCAGTT GGCTGAAAAC 
CGGGATATCC TCCTGTTTTG TGATGAGGTC TATCGCGAAT CGGAATACGA TGTCTCGCGC 
CGTCTGCCCG CTGTCTGTGA CTGCTGCCAG ACCGGTGTTT CGCTTGGCGT GACCTCCAAG 
ACCTACGGGC TGCCCGGGTT GCGGATCGGC TGGCTGGCCA CACGCCGTCG GGATGTCCTG 
GCCGCAGTGG CCCAGTTGAA AGACTATACG ACGATCTGCA ACAGTGCGTC GAGCGAATTT 
TTGGCTGAGT TGGCCCTGCG CCACCGGGAA CACCTTGCCG AGCGCAGTGT GCGCTTGATA 
CAAACAAACC TTGCTTTGCT GGACGGGTTT TTTGCCCGGC ATGCTGAGCG ATTCGAATGG 
CGACGTCCCC ATGCCGGTCC AATCGCGTTC CCGCGTTTGC GTGATGAAGA CGCGGACGAT 
TTTTGCCACC AAGCGGTGGA GCAGGCGAGT GTCCTTTTGT TGCCGGGATC GCTTTACGAG 
TATCCCGGCG GTGCATTTCG CATTGGCTTT GGCCGGGCCA GTCTCCCTCA GGCCTTGGAA 
GCCCTTGAAA ATTTTCTCCA GCGGTAG

Protein sequence

MRLQPFKLER YFAKYEFNVR HLLSSSDCES MTVADLLDLE PGAAERFHNV WLGYTESEGS 
PTLRETIASM YNAQQADDIL VHSGAEEAIF LFMNAVLEAG DHVVVHWPCY QSLTEVPRSI 
GCEVDLWKAR EEAQWGLDLE ELDELLKPNT KAIIVNLPHN PTGYLMEPET FSRLCQLAEN 
RDILLFCDEV YRESEYDVSR RLPAVCDCCQ TGVSLGVTSK TYGLPGLRIG WLATRRRDVL 
AAVAQLKDYT TICNSASSEF LAELALRHRE HLAERSVRLI QTNLALLDGF FARHAERFEW 
RRPHAGPIAF PRLRDEDADD FCHQAVEQAS VLLLPGSLYE YPGGAFRIGF GRASLPQALE 
ALENFLQR