Gene Dret_1504 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1504
Symbol
ID	8419333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1744540
End bp	1745610
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	55%
IMG OID	645038078
Product	hypothetical protein
Protein accession	YP_003198368
Protein GI	258405626
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00430527
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAGGCA AATCGATCTT TATTCTGGCC TGCGGCATTC TCCTCTTGTG TGTCTGGCCG 
GTGCAGTCCG ACCAGCAGCA GGACTGCTTC AGAACCAGCC TGCACCACAC CACCCGCGGC 
ATGGCCACCT GGTATGACGC GGACAACGGT TTCAGCGCCA TCACCAATGT CCCCTACAAG 
GACCTGGGAT GTAAAAATTG CCATGCCACC TCCTGCAACG ATTGCCATCT TGAAAAATCC 
GGTGAGGGCT TTGCGTACTC CACGGCCAAG GCACGGCAAT CCTCGACTTG TCTCAAATGT 
CACGCCCGGG AGAAGGCCAC CATCGGGATC GACACCGCCA GAAACTCCCT CGGCGTTCAT 
ATCAAGGCCG GCATGCAATG CGCGGATTGC CATTCAGCCA GGGAAGTCCA CGGTGATGGA 
ACCTGCTATG AAAGCATGCG CGCGCCAGGG GCAATGGATA CGGCCTGCAC AAATTGCCAC 
ACCGAGGACA GCACCACCTA TCCGGCCATC CCCCCGACCG AATCGCATAT GGTCCACAGC 
GGCAAACTCG ACTGTACAGC CTGCCACGTG GAAAACTCCA TGACCTGCTA CAATTGCCAT 
TTCGGTGTTT TGCAAAAGAC CAAGAGCAAA CCAAAAAGCA TGGTCACCAA AACCAAGGAT 
TTCCTGCTGC TTGTCAAATA TAACGGCAAA TTCATGAGTG GAACCATGCA GACGCTGGTT 
GGCCCCGATA ATTACCCCTT CGTGGCCTAC GTTCCCTATT TCACCCATTC AGTGACCGAG 
CAGGGGCGAA AATGCGAAAG CTGCCACTCC TCCAAGGCCC TCAAAGAGTT GGCTGCGGGC 
AAGTCGTTCA ATGCCTCCAC CTACAAGGAC GGGAAACTCA GTTTTTTCGA GGGGGTCATC 
CCGGTGGTTC CCGACCAGAT CAACTGGACT TTTCTGGAGA AAGCCGGGGA ACAGTGGACG 
CCGTTTGAGC CGCCAGCCAA ACCGCTGGTC CAGATGGCGG TCTACGCTGA GCCCTTTACC 
GACGACGAAC TGGAGATGAT GAACATGGAA CAGGTTTACA CCGGACAATG A

Protein sequence

MKGKSIFILA CGILLLCVWP VQSDQQQDCF RTSLHHTTRG MATWYDADNG FSAITNVPYK 
DLGCKNCHAT SCNDCHLEKS GEGFAYSTAK ARQSSTCLKC HAREKATIGI DTARNSLGVH 
IKAGMQCADC HSAREVHGDG TCYESMRAPG AMDTACTNCH TEDSTTYPAI PPTESHMVHS 
GKLDCTACHV ENSMTCYNCH FGVLQKTKSK PKSMVTKTKD FLLLVKYNGK FMSGTMQTLV 
GPDNYPFVAY VPYFTHSVTE QGRKCESCHS SKALKELAAG KSFNASTYKD GKLSFFEGVI 
PVVPDQINWT FLEKAGEQWT PFEPPAKPLV QMAVYAEPFT DDELEMMNME QVYTGQ