Gene Dret_2197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2197
Symbol
ID	8420053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	2499979
End bp	2501079
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	58%
IMG OID	645038796
Product	histidinol-phosphate aminotransferase
Protein accession	YP_003199059
Protein GI	258406317
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAGT TTTCCCGTGT GCGACCGGAG ATTGCCGGTT TGAAACCCTA TACCCCTGGG 
CTGTCTATCG AAGAAATCAA GGATCGGTAT GCATTGACCA CTGTGTGCAA GATGGCCAGC 
AACGAAAATC CACTAGGCAC CTCGCCGCTG GTCCAGGAGG CGTTGTGCCG GTTTGCGCCG 
TATGCCTTTC GCTATCCGCG CGGCGGATGT CCGGATTTGA GTGCGGCTTT GGCCAAAGTG 
CTGGGGGTCC CCGGGGAGTG CGTCGTGGTC GGCAACGGTT CGGATGAATT GATTGATCTC 
TTGATCCGAA CCACGCTGCG CCCCGAAAAG GACAATATGG TCGTTTTTGA TCCCAGCTTT 
AGTATTTATC GGATGCAGGC CACCTTGTGC GGTGTGGAAT GCCGACAGGT TCCGCTTGAG 
CAGGACCTGA CATTTGACTT TGATCGGTTG CTGGAGCAGG TGGATTCCCG AACCGGGCTG 
GTTTTCGTGA CCAACCCGGA CAATCCGTCC GGCCACGCCG TACCTGCGGC GCAGCTTATG 
GAACTCGCCC GGTCCCTGCC TCAGCAGTGT CTGCTGGTAG TGGACGAGGC GTATATTGAA 
TTCGCCGAAA ACGGCATCTC CCCCCTGGCC GATTGGGATG CACACGGAAA TATCGTCTTG 
CTGCGCACCT TTTCGAAACT CTATGGGCTG GCCGGTTTGC GCCTGGGCTA CGGGATCATG 
CCGGATTGGT TGGCCGAGGC CGTACTGCGG ATCAAATTGC CCTTTAGCGT CAACCTGTTG 
GCTGAAAAGG CAGGCGTCGC CGCGCTGGAA GACACCGCCT TCTATACCCG GACCAGGGAG 
GTCGTTGGCG AGGGACGGCG TATCTTGAGC GCGGGGTTGC GGGAGTTGGG CTGCGAGGTC 
AGTCCGTCAC AGGCCAATTT CCTCCTCTTC CGTCCCCCGA TGCCCGCGCG CGAGGTTTTC 
GAGCGTCTGC TGGCCAAAGG GATCATCATC CGCCCCCTGA CCAGCTACGG CCTGGAAGAT 
GCTCTGCGTG TCAGTGTCGG TACCGCTCAT GAGAATTCCA GATTCCTTGA AGCCATGCAG 
GAGATAGTCC ATGCCCGCTA A

Protein sequence

MAKFSRVRPE IAGLKPYTPG LSIEEIKDRY ALTTVCKMAS NENPLGTSPL VQEALCRFAP 
YAFRYPRGGC PDLSAALAKV LGVPGECVVV GNGSDELIDL LIRTTLRPEK DNMVVFDPSF 
SIYRMQATLC GVECRQVPLE QDLTFDFDRL LEQVDSRTGL VFVTNPDNPS GHAVPAAQLM 
ELARSLPQQC LLVVDEAYIE FAENGISPLA DWDAHGNIVL LRTFSKLYGL AGLRLGYGIM 
PDWLAEAVLR IKLPFSVNLL AEKAGVAALE DTAFYTRTRE VVGEGRRILS AGLRELGCEV 
SPSQANFLLF RPPMPAREVF ERLLAKGIII RPLTSYGLED ALRVSVGTAH ENSRFLEAMQ 
EIVHAR