Gene Dret_1107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1107
Symbol
ID	8418932
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1299650
End bp	1300594
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	58%
IMG OID	645037679
Product	aminotransferase class IV
Protein accession	YP_003197973
Protein GI	258405231
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0639089
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0333795
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCCGCA CCATCTCAGA CCAGAGCTAT CTTGAGGCCC TTTTGGCAGC CCCCCGGCCG 
GGAATCGATC AGGTACGGGC TTTCTATGAC CACCGCGTCG GTGTGATCGG GAAGGATCCC 
CGGTATCTGC TTATTCCCAT GGATGACCAC TTGGTCCATC GGGGCGACGG GGTCTTCGAA 
ACCCTGAAAT TTACTGCGAA GCGGTTGTAC CAACTTGATG CCCATGTCGA GCGCCTCTTC 
CATTCCGCTA AGACCATCGC CATCCATCCT CCGTGTTCGC GAGAGGACGT TCGGGAGTTG 
ATCATAGACC TTGCCGCGGC TTCAGAACTC GAAAACGGTA TCGTGGCTGT GTACGTGGGG 
CGCGGCCCCG GCGGGTTTTC CGCAGATTTC CGGGAATGCC CCCAGCCCAG CCTGTACGGC 
GTGGCCCGGA TCATGCCAGA GCGCCCGGAA GAGCTTTGGG AAAAGGGAGT GACCGCGTAC 
ACGACCAGTT TCCCGGCCAA ACAATGCTAT CTGTCGCGGA TCAAGACCGT TGATTATCTC 
CCCAATGTGC TCATGAAGCG TGAGGCCGTG CTCAAGGGAT ACGATTACCC CCTGTGTTTC 
GACGAACAAG GGTTTTTGGC CGAAGGAGCC ACGGAAAATG TCTGCCTGGT CAATGCCTCG 
GGCGAATTGA TCGTCCCGGA ATTGCGCAAT GCTTTACCTG GTACGACTCT ATTGCGCGGC 
CTGGATCTCA TCCGACCGGA ACTGCCGGTT GAACACCGTT TAGTGAAAGA GGATGAACTC 
TATCAGGCCA AGGAACTCAT TTTGCTGGGC ACCTCGTTGG ATGCCATCAG TGTGGTCCGT 
TTTAACGGCC GGCCGATCCA CGATGTCCGG CCCGGACCGG TCAGCCGCCG TTTGCGGCAG 
TTGTTGCGGG AAGACCAAGA GCGCAACGGG ACACCGATTC ATTGA

Protein sequence

MPRTISDQSY LEALLAAPRP GIDQVRAFYD HRVGVIGKDP RYLLIPMDDH LVHRGDGVFE 
TLKFTAKRLY QLDAHVERLF HSAKTIAIHP PCSREDVREL IIDLAAASEL ENGIVAVYVG 
RGPGGFSADF RECPQPSLYG VARIMPERPE ELWEKGVTAY TTSFPAKQCY LSRIKTVDYL 
PNVLMKREAV LKGYDYPLCF DEQGFLAEGA TENVCLVNAS GELIVPELRN ALPGTTLLRG 
LDLIRPELPV EHRLVKEDEL YQAKELILLG TSLDAISVVR FNGRPIHDVR PGPVSRRLRQ 
LLREDQERNG TPIH