Gene Dgeo_1374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_1374
Symbol
ID	4057533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	-
Start bp	1454604
End bp	1456205
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	65%
IMG OID	641230389
Product	ABC transporter related
Protein accession	YP_604838
Protein GI	94985474
COG category	[R] General function prediction only
COG ID	[COG3845] ABC-type uncharacterized transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.534066
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTGG CCAACAAGGA CGTGCTGCAA GCGGTGCGGC ACAACTCCGA ATACGCGCTG 
GAACTGCGGA ACATCACCAA ACGCTTTCCG CTGGTGCTGG CGAACGACAA TATCTCTATG 
CAAGTGCGCT GGGGCAGCGT TCACGCTCTG TGCGGTGAAA ACGGCGCCGG CAAAAGCACC 
CTGATGAAGA TCGTGTATGG GGCCCAGCCC CCCACCAGCG GCGAGATCGT GGTGGATGGC 
CAGCCGGTCC ACTTCACCGA CCCCTCGCAG GCCATCGCTC ACGGCATCGG CATGGTCTTC 
CAGCACTTCA TGCTGGTCGA TACCCTGACG GTCACCGAGA ACGTGATCCT GGGAGCCGAG 
CCGCGAGCGG GCACCTCCAT CGACTATGCC GGGGCGCGCC GCCGCGTGGC CGAGCTGATC 
GAGCAGTTCG GCTTTGATCT CAACCCTGAC GCGCTCGTGG GCGACCTGCC GGTGGGCCTC 
CAGCAGAAGG TGGAAATTCT CAAGACGCTT TACCGCGGCG CGCGCATCTT GATTCTGGAC 
GAGCCGACTG CCGTCCTCAC ACCGACCGAG ACAGACGAAC TCTTCGACTT TCTGAAAAAT 
CAGTACGCGG CAAGTGGCAA CGCGGTCATT TTCATCAGCC ACAAGTTGCA TGAGGTGCTG 
CAGATCAGTG ACACCATCAG CGTCATCCGT GACGGCAAAA TGATCGGCAG CATTCCCGCC 
CAGGGCGCGA CCACCGAGAC CCTGGCCCGG ATGATGGTGG GCCGCGACGT GAGCCTGAAG 
GTGCATAAGG CCCCCGCCCG GCCCGGCGAG GTGGCCCTCG ATGTCCGCAA CGTCACTGTC 
AAGGGTGAAC ACGGCAACGC CGTGGATGGT GTCTCCTTCC AGGTCCGTTC GGGCGAAATC 
GTCGGGATCG CGGGCGTGGA GGGCAACGGC CAGAGCGAGC TGGTGGAGGC GATCACCGGC 
CTGCTGCCGG TTGCCAGCGG CGAGATCACC TATCTGGGCC GTCACGCGCG CGGCGTGCGC 
GAGGTGGAAG CGAGCGGCGT CTCGCACATC CCGGAGGACC GCAACGAGCG CGGCCTGGTG 
CTGGAGATGA CCACCGCCGA GAACTACATC CTGGGCGAAC ATGACCGCGC TCCCTTCGCT 
GGCCCGCTGG GATTCCTGAA TCTGGAGGCC ATCGAGGAAA ATGCCCGCCA GCTCAGTGAG 
AAGTACGACG TTCGCCCCCG CAGCGTCAGC CTGCAAGCGG GCCGTTACAG CGGCGGCAAC 
GCCCAGAAGC TGATTGTGGC GCGCGAGATG CGCAAGCAGC CCAAAATCCT GATCGCCTCG 
CAGCCTACCC GCGGGGTGGA CATCGGCGCC ATCGAGTTCA TCCACGCCCG CATCGTGGAG 
GCGCGCGACC AGGGCCTCGC CGTGCTGCTC GTCAGTGCCG ACCTGGGCGA GGTGATGAAC 
CTCTCCGACC GCATCCTGGT GATGTACGAG GGCCGGATCG TGGGTGAGGT GGAGGCCGCC 
ACCGCCACCG AGACGCAGCT CGGCCTGCTG ATGACCGGCA GCGGGGGCAC GGGCGGGCGC 
AGCGGTGCCG TGAGCGACAC CCAGGAATAC GGCACGCGCT GA

Protein sequence

MTVANKDVLQ AVRHNSEYAL ELRNITKRFP LVLANDNISM QVRWGSVHAL CGENGAGKST 
LMKIVYGAQP PTSGEIVVDG QPVHFTDPSQ AIAHGIGMVF QHFMLVDTLT VTENVILGAE 
PRAGTSIDYA GARRRVAELI EQFGFDLNPD ALVGDLPVGL QQKVEILKTL YRGARILILD 
EPTAVLTPTE TDELFDFLKN QYAASGNAVI FISHKLHEVL QISDTISVIR DGKMIGSIPA 
QGATTETLAR MMVGRDVSLK VHKAPARPGE VALDVRNVTV KGEHGNAVDG VSFQVRSGEI 
VGIAGVEGNG QSELVEAITG LLPVASGEIT YLGRHARGVR EVEASGVSHI PEDRNERGLV 
LEMTTAENYI LGEHDRAPFA GPLGFLNLEA IEENARQLSE KYDVRPRSVS LQAGRYSGGN 
AQKLIVAREM RKQPKILIAS QPTRGVDIGA IEFIHARIVE ARDQGLAVLL VSADLGEVMN 
LSDRILVMYE GRIVGEVEAA TATETQLGLL MTGSGGTGGR SGAVSDTQEY GTR