Gene Dret_2027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2027
Symbol
ID	8419872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	2324906
End bp	2326096
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	59%
IMG OID	645038615
Product	aspartate aminotransferase
Protein accession	YP_003198889
Protein GI	258406147
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000000277317
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0077207
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCGATGT TGAGCCAACA GGTGCAGACC TATTTGGAAA GTTCCTCATG GATCCGCCGG 
ATGTTCGAGG CCGGGCGGGA GATGAAGGCC AAATACGGCG AAGACCAGGT GTATGATTTC 
AGTTTGGGCA ATCCGGACCT CCCCCCGCCT GCAGCCGTGA CCAAAGGGTT GCAGCGCCTG 
GCTGAACAGG CGCAGTCGTC CTATGCCTTC GGGTATATGC CCAATGCCGG GTATCCTGAT 
GTCCGGCAAG CCCTGGCCCA GCGCTTGTCC CGCGAGCAGC AGGTCGCGCT TTCCGAGCAG 
GAACTGTTGT TGAGCTGTGG GGCCGCCGGA GGGCTGAATG TGTTGTTCCG GGCGATCCTG 
GAGCCCGGGG ACGAAGTGGT CTGTCCCGCG CCCTTTTTTG TGGAGTATAC CTTTTACGTC 
CAAAACCACG GCGGCGTCCT GCGCACGGTC CCCTCACGCG AACCGGATTT CGCTCTGGAT 
ATTGAAGGCA TTGAGGCGGC TCTCTCGGAG AAGACCCGGA TTGTGCTCAT CAATTCCCCC 
AATAACCCGA CCGGGCGGGT CTATTCTGCA TCGGAGCTGC GCCAACTCGC GGCTGTCCTC 
GACGCAGCAA GCCGCAAGTA CGGCCGGCCC ATCCTGCTTG TGTCCGACGA GCCGTACCGT 
TTCTTGACTT TTGACGGAAC GCAGGTGCCC CCTGTTTTGC CGGCCTACCA ACACAGTGTG 
GTGGTCAGTT CCTTTTCCAA GAATCTGTCC CTGGCCGGAG AACGGGTCGG GTATTTGGCT 
TTGAATCCGG AGATGCCTGG AAAAGAGGAA CTTATGGACG GCTTGGTATT GACCAACCGC 
ATCCTCGGTT TTGTCAATGC TCCAGCCCTT GGCCAGCGTC TTGTCGGCTA TTGCCTGGAG 
GCCTCGGTGG ATCTCGAGGT CTATGAAAAA CGACGGGCGG CCATGGTCGA GGCCCTTGAC 
GCCGGGGGCT ATACCTATGC CGTGCCCCAA GGGGCGTTTT ATTTCTTTGT CCAGGCCCCA 
GGCGGCGACG ATGTCGCCTT TGTCCAGACC CTCCAGGAAG AGCGGGTTTT GGCTGTCCCA 
GGTTCCGGAT TCGGTTTTCC CGGCTATTTC CGGTTGTCTT TTTGCGTTCC TGAAACGGTT 
ATTCGCAATG GCGCCGCCTC CCTGGCCCGG GCCCGTCAAC GGTGGCAATG A

Protein sequence

MSMLSQQVQT YLESSSWIRR MFEAGREMKA KYGEDQVYDF SLGNPDLPPP AAVTKGLQRL 
AEQAQSSYAF GYMPNAGYPD VRQALAQRLS REQQVALSEQ ELLLSCGAAG GLNVLFRAIL 
EPGDEVVCPA PFFVEYTFYV QNHGGVLRTV PSREPDFALD IEGIEAALSE KTRIVLINSP 
NNPTGRVYSA SELRQLAAVL DAASRKYGRP ILLVSDEPYR FLTFDGTQVP PVLPAYQHSV 
VVSSFSKNLS LAGERVGYLA LNPEMPGKEE LMDGLVLTNR ILGFVNAPAL GQRLVGYCLE 
ASVDLEVYEK RRAAMVEALD AGGYTYAVPQ GAFYFFVQAP GGDDVAFVQT LQEERVLAVP 
GSGFGFPGYF RLSFCVPETV IRNGAASLAR ARQRWQ