Gene Dshi_2197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2197
Symbol
ID	5713850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	2324302
End bp	2325957
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	64%
IMG OID	641268119
Product	putative ABC transporter ATP-binding protein
Protein accession	YP_001533534
Protein GI	159044740
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCCT ATCAGTACGT CTACCACATG GACGGCGTGT CCAAGACCTA TCCCGGCGGC 
AAGAAATGCT TCGAGAACAT CCGCCTCTCC TTCCTTCCGG GCGTCAAGAT CGGCGTCGTC 
GGCGTCAACG GCGCGGGCAA GTCCACCCTA ATGAAGATCA TGGCCGGCCT CGACACCGAC 
TTCACCGGGG AGGCTTGGGC CGCCGAAGGC GCCCGCGTCG GCTACCTGCC CCAGGAGCCC 
GCCCTCGACG AGACCCTCAC CGTGCGCGAG AACGTCATGC TCGGCGTCGC CCCCAAGAAG 
GCCATCCTCG ACCGCTACAA CGAGCTGGCG ATGAACTACT CCGACGAGAC CGCCGACGAG 
ATGGCGAAGC TCCAGGACGA GATCGACGCG CAAAACCTCT GGGACCTCGA CGCCCAGATC 
GACATCGCGA TGGAGGCGCT GCGCTGCCCC CCCGACGACG CCAGCCCCGC GAACCTCTCG 
GGCGGGGAGC GCCGCCGCGT CGCACTCTGC AAGCTCCTGC TCGAAGCCCC CGACATGCTG 
CTCTTGGACG AGCCCACCAA CCACCTCGAC GCCGAAACCA TCGCCTGGCT CCAGAAACAC 
CTGATCGAGT ACAAGGGCAC CATCCTCATC GTCACCCACG ACCGCTACTT CCTCGACGAC 
ATCACCGGCT GGATCCTGGA ACTCGACCGC GGCCGCGGCA TCCCCTACGA GGGCAACTAT 
TCCGCCTGGC TCGACCAGAA GGCCAAGCGG CTCGAACGCG AGGCCAAGGA AGACAAGGCG 
AAACAGAAAA CCCTCGCGCG CGAGCTCGAA TGGATCCGCG CCGGCGCCAA GGCCCGCCAG 
GCCAAGCAGA AGGCCCGCAT CAACGCCTAC GAAGAACTCG CCGGCCAGTC GGAGCGCGAA 
AAGGTCGGCA AGGCCCAGAT CATCATCCCC AACGGCCCCC GCCTCGGGAG CAAGGTGATC 
GAGGTCGAAA ACCTCACCAA AGCTTATGGC GACAAGCTGC TGATCGAGAA CCTCTCCTTC 
TCCCTGCCGC CCGGCGGCAT CGTCGGCGTG ATCGGCCCCA ACGGGGCGGG CAAATCCACA 
CTCTTTCGCA TGCTGACAGG GCAGGAGCAG CCCGATGGCG GCACGCTCAG CTACGGCGAC 
ACGGTGCAAC TGGCCTATGT CGACCAGTCC CGCGACACGC TCGACCCCGC CGCCACCGTC 
TGGGAGGAGA TCTCCGGCGG CGGCGAAATC ATCGAGCTTG GCGACGCCCA GATCAACTCC 
CGCGCCTATT GCGGCGCGTT CAACTTCAAG GGCGGCGACC AGCAGAAGAA GGTCGGGCTC 
CTGTCGGGCG GCGAACGCAA CCGCGTCCAC ATGGCGAAAC TGCTGAAATC CGGCGGCAAT 
GTCCTCCTGC TCGATGAACC TACCAACGAT CTTGACGTGG AAACGTTAAG AGCGCTTGAA 
GACGCCATCG AGGATTTCGC CGGCTGCGCC GTGGTCATCT CCCACGACCG CTTCTTCCTC 
GACCGCCTCT GCACCCACAT CCTCGCCTTC GAGGGCGACG CCCATGTGGA ATGGTTCGAG 
GGGAACTTCG AAGCCTACGA GGAAGACAAG GCACGGAGAC TGGGGCCGGA TGCCCTCGAA 
CCCAAGCGCG TGAAATACAA GAAATTCACC CGTTAG

Protein sequence

MAAYQYVYHM DGVSKTYPGG KKCFENIRLS FLPGVKIGVV GVNGAGKSTL MKIMAGLDTD 
FTGEAWAAEG ARVGYLPQEP ALDETLTVRE NVMLGVAPKK AILDRYNELA MNYSDETADE 
MAKLQDEIDA QNLWDLDAQI DIAMEALRCP PDDASPANLS GGERRRVALC KLLLEAPDML 
LLDEPTNHLD AETIAWLQKH LIEYKGTILI VTHDRYFLDD ITGWILELDR GRGIPYEGNY 
SAWLDQKAKR LEREAKEDKA KQKTLARELE WIRAGAKARQ AKQKARINAY EELAGQSERE 
KVGKAQIIIP NGPRLGSKVI EVENLTKAYG DKLLIENLSF SLPPGGIVGV IGPNGAGKST 
LFRMLTGQEQ PDGGTLSYGD TVQLAYVDQS RDTLDPAATV WEEISGGGEI IELGDAQINS 
RAYCGAFNFK GGDQQKKVGL LSGGERNRVH MAKLLKSGGN VLLLDEPTND LDVETLRALE 
DAIEDFAGCA VVISHDRFFL DRLCTHILAF EGDAHVEWFE GNFEAYEEDK ARRLGPDALE 
PKRVKYKKFT R