Gene Dshi_2023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2023
Symbol
ID	5713018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	2142820
End bp	2144499
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	68%
IMG OID	641267947
Product	putative ABC transporter permease component
Protein accession	YP_001533363
Protein GI	159044569
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1178] ABC-type Fe3+ transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.967123
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.0816083
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAACCC TGTCCGATCC CTCTGGCGAG CGTCCCGTGA AAAGCCGTGC CCGCAAGCGC 
CGCGAGGCCC GGCTGCTGGG CACGGGCGCG CTCGTGCTCG CGGCGCTCTG CCTGCTGCCC 
ATGCTCGCGG TCCTGATCAC GGCGCTGTCG GGGGGGACCG ATACCCTGGC CCAACTCGCC 
GACACCGTGC TGCCCGGCTA TACCGGCGCA ACCCTGGCGC TGGTGGTGCT CGTCGGCACC 
GGCACCTTCA TGATCGGGAC CTCCACAGCC TGGCTCATAT CGATGTACGA GTTCCCTGGT 
CGCCGCTGGC TGGAGGTGCT GCTGGTCCTG CCGCTGGCCT TTCCGGCCTA TGTGCTGGCC 
TATGCCTATA CCCATGTGCT CGACCATCCC GGCATCGTTC AGGCGACGCT GCGATCGGTG 
ATGGGCTGGG GACCGCGCGA CTACTGGTTT CCCGAGATCC GCTCGCTGGG CGGGGCTGCG 
GCCATGCTGA TCCTCGTGCT CTACCCGTAT GTCTATCTGC TCGCCCGCGC GGCTTTCGTG 
CAGCAGAGCG CCACCACTTT CTTTGCCGCC CGCGCCCTGG GCCGCACGCC TTTCCGCGCC 
TTCCTGGAGG TCTCCATGCC CATGGCGCGC CCTGCCATCG CCGCGGGCGT CCTGCTGGCC 
ACCATGGAGA CCATCGCCGA TTTCGGCACC GTGTCCTATT TCGGCGTCCA TACCTTCGCC 
ACGGGCATCT ATACCAGCTG GTTCAACATG GGGGACCGGG TGGCCGCGTC CCAGCTTGCC 
CTCGGGCTTC TGGGCTTCGC GCTCCTGCTC GCGGTGCTGG AGCGTCAAAG CCGCGGTTCT 
GCCAAGTACC ACGGCGGCAA GCGGCAGGAG GCCATGCCCC GCACCACCCT GACCGGCTGG 
CACCGCTGGA GCGCGACGAT CCTGTGCGGC GCGCCGGTGC TTCTCGGCGT GGCCATCCCG 
ATCGTCACCC TGCTGGTCAT GGGCATCGGG TCCGAGCAGA ACCTGCTCAG CCGCCGCTAC 
ATTCGTTTCA TCACGAATTC CCTGACCCTG GCCTCGGCGG CGGCGGTTCT GACGGTCTGC 
GCGGCGGTGA TCCTGGGGTA CTACCAACGC GTCCGCCCCG GCCCGCGCTC GGACGCGGCT 
CTCTATATCG CGCGGCTCGG CTACGCGATC CCGGGCGGGG TGATCGCGGT AGGGCTTCTG 
GTGCCCTTCG CGCTCTTCGA CAACACGCTC GATGCCTGGA TGCGCGCCAA TTTCGACCTC 
TCCACGGGGC TGCTGCTGAC CGGATCGATC TGGCTTCTGG TGGGGGCCTA CATGATCCGG 
TTTCTCGCCG CGGCGCTGGG CGCCTACGAG GGCGGACAGG CGACGATCAA CCTCAATCTC 
GACTATGCCG CGCGGGTGCT GGGCCAGACC GCCTACGGCA CCCTGCGTCG GGTGCACCTG 
CCGATCCTGA CGCCAAGCCT GCTGACGGCG CTGCTGATCG TGTTCGTCGA CGTTATGAAG 
GAATTGCCCG CGACGCTCAT CATGCGGCCC TTCAACTACG ACACGCTGGC GGTGCAGGCC 
TACCGGCTGG CCTCAGACGA ACGGCTCGAA GGGGCGGCCG TGCCCAGCCT GCTGATCGTG 
GCCGTGGGGC TCTTGCCGGT TATCCTGCTC TGCCGCCAGG TCCGCCGCCA ATCGCGCTGA

Protein sequence

MATLSDPSGE RPVKSRARKR REARLLGTGA LVLAALCLLP MLAVLITALS GGTDTLAQLA 
DTVLPGYTGA TLALVVLVGT GTFMIGTSTA WLISMYEFPG RRWLEVLLVL PLAFPAYVLA 
YAYTHVLDHP GIVQATLRSV MGWGPRDYWF PEIRSLGGAA AMLILVLYPY VYLLARAAFV 
QQSATTFFAA RALGRTPFRA FLEVSMPMAR PAIAAGVLLA TMETIADFGT VSYFGVHTFA 
TGIYTSWFNM GDRVAASQLA LGLLGFALLL AVLERQSRGS AKYHGGKRQE AMPRTTLTGW 
HRWSATILCG APVLLGVAIP IVTLLVMGIG SEQNLLSRRY IRFITNSLTL ASAAAVLTVC 
AAVILGYYQR VRPGPRSDAA LYIARLGYAI PGGVIAVGLL VPFALFDNTL DAWMRANFDL 
STGLLLTGSI WLLVGAYMIR FLAAALGAYE GGQATINLNL DYAARVLGQT AYGTLRRVHL 
PILTPSLLTA LLIVFVDVMK ELPATLIMRP FNYDTLAVQA YRLASDERLE GAAVPSLLIV 
AVGLLPVILL CRQVRRQSR