Gene Dret_1567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1567
Symbol
ID	8419397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1815968
End bp	1816987
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	60%
IMG OID	645038140
Product	Tetratricopeptide TPR_2 repeat protein
Protein accession	YP_003198429
Protein GI	258405687
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4235] Cytochrome c biogenesis factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00816314
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0470804
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAATG CGTCGCGTTC AAAGGTCCTC GCCGGGGTGG CAATCTGCCT CGGATGGATT 
TTCCTGGCGG GCTGCGCCAA TCTGCAAACT CGATTCGACA GTGTCCTGAC CTCGTATCAG 
GGACAGCGCT ACCTGGAAGA ACACGAATAC GCCCTGGGGG TCGAGGACTT GTCCCACCGG 
CTCAAGCAGC AGCCGGACAA CGGTGCGGCC GCCTATTGGC TGGGCCGGCT TTATCTGGCC 
CAGGAGCACC CCAGCAAGGC CCTGCCTGCT TTACAAAAAG CGGTGGAACT CAAACCGCAA 
TACGCAGACG CCCATTTCTG GCTCGGTGTC GCCCATTGGG CGATGATGGA TTTCGAGAAG 
GAGCGGTTGG CCTATGAACG GGCTCTGGCT CTCGAGCCTG ACCACACCCA GGCACGGGTC 
TATCTCGGCC ACCATTATGT GGATCGGGAG CAATGGTCTC TGGCCCTGAT CCATTATCGG 
CGTGTCCTGG ATGAAGAGCC CGGCCATCCT TCCGCTCTTT TTTATACGGC CGAATGTCTG 
GAACAACTGG GGCGGGAACA AAGCGCCCGG CAGGCCTGGA AAGCGTATCT GGACCGCTAT 
CCCGACGGTG GGCGGGCCCT GGAGGCGACC CGGCGTCTGA ACGGGTTCGG CGACTTCAGT 
TATCGCAACA TCATTCTCGG CAAGCGGCAG GTGACCATCG AAAAAATCCG TTTCGAACAG 
GGCACAGCCA CATTGAAGTC CTCCAGTCTG CCCTCACTGG ATCTGATCGG GGCGAACCTG 
GAGCGCCGTT CTGATCTCCG TTTGCACGTG ATTGTCTATG TCCAGGAGGA TGCAGCGCTG 
GCCCGGAAAC GGGCGCAGGC CATTGAGGAG GCGATTGTCC AGCGCACGAG CGGAGCCGAT 
TCCGAACAAC TCCTCTTGAG CTGGTTCGGT CAGGCCGAAA CGATCACAGT GGATGGCGAA 
CGTTTCCAAG AACCGCGGTC GGTCCATTTT GTCACCGAGG CCGGGCCGGA CGTATCCTGA

Protein sequence

MPNASRSKVL AGVAICLGWI FLAGCANLQT RFDSVLTSYQ GQRYLEEHEY ALGVEDLSHR 
LKQQPDNGAA AYWLGRLYLA QEHPSKALPA LQKAVELKPQ YADAHFWLGV AHWAMMDFEK 
ERLAYERALA LEPDHTQARV YLGHHYVDRE QWSLALIHYR RVLDEEPGHP SALFYTAECL 
EQLGREQSAR QAWKAYLDRY PDGGRALEAT RRLNGFGDFS YRNIILGKRQ VTIEKIRFEQ 
GTATLKSSSL PSLDLIGANL ERRSDLRLHV IVYVQEDAAL ARKRAQAIEE AIVQRTSGAD 
SEQLLLSWFG QAETITVDGE RFQEPRSVHF VTEAGPDVS