Gene Dshi_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2021
Symbol
ID	5713016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	2141284
End bp	2142312
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	65%
IMG OID	641267945
Product	putative binding protein component of ABC iron transporter
Protein accession	YP_001533361
Protein GI	159044567
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.104601
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGTAC GACTTTCTCT GCCGCTTGCC GGTCTGACCG CCGCGGCCAC GCTGCTCGGT 
TCCGTGGCCT ATGCTGCGGG TGAGCTGAAC CTCTATTCGT CGCGTCACTA CGACACGGAC 
GAGCGGCTCT ACTCGGATTT CGAAGAGGCC ACGGGCATCA CCGTAAACCG GATCGAGGGT 
AACGCCGACG AACTGATCGC GCGGATGGAG GCCGAGGGCG CCAACAGCCC GGCGGACGTA 
TTCCTGACCG TGGACACGGT GCGTCTGGCA CGGGCCAAGG ATCTCGGCCT GCTGCAATCG 
GTGGACAGCC CGATCCTCGA GGGGCGCATC CCGGCCTACC TGCAGGATGA CGACAACCAG 
TGGTTCGGCT TCTCGCAGCG CGCGCGCATC CTGTTCTACG ACAAGACCGA CGTGGAAAAC 
CCGCCGGCCA CCTATCAGGA CCTGGCGAAG CCGGAATATG AGGGCATGGT CTGCATCCGG 
TCCTCCACCA ACGTCTATAC CCAGAACATC GTCGCGGCCC TGATCGAGCA TCTGGGCGAA 
GAAGCGGTGA CCGACTGGGC CAAGGCCGTG GTCGGCAACT TCGCCCGCGC GCCTCAGGGC 
GGCGATACCG ATCAGCTGCG CGGCATCGCC TCGGGCGAGT GCGACATCGC GATGTCGAAC 
ACCTATTACT ACGCCCGCGC GACCCGGAAG GGCGACAGCA CCATGTCCGA GGAAGACCTC 
GCAAATATCG GCTGGGTGTT CCCGAACCAG AACTCGATCG GGGCGCATAT GAACATCTCC 
GGCGGCGGGG TGGCCGCGAA CGCGCCGAAC CGCGACAACG CGGTGAAGTT CCTCGAGTAC 
CTGTCGTCCG TGCAGGCGCA GGAGTATTTC TCGGCCGGCA ATGACGAATA TCCCGCGGTG 
CCCGGTGTTG GCCTTTCGCC GTCGGTTGCG GCCCTCGGCA TCTTCCGTCC GGACGTGATC 
GACCTGTCGG CCATCGGCAA CAATGTCGAC GCAGCCCAGC GCGTGCTGAC CGCGGCCGGC 
TGGGAGTAA

Protein sequence

MPVRLSLPLA GLTAAATLLG SVAYAAGELN LYSSRHYDTD ERLYSDFEEA TGITVNRIEG 
NADELIARME AEGANSPADV FLTVDTVRLA RAKDLGLLQS VDSPILEGRI PAYLQDDDNQ 
WFGFSQRARI LFYDKTDVEN PPATYQDLAK PEYEGMVCIR SSTNVYTQNI VAALIEHLGE 
EAVTDWAKAV VGNFARAPQG GDTDQLRGIA SGECDIAMSN TYYYARATRK GDSTMSEEDL 
ANIGWVFPNQ NSIGAHMNIS GGGVAANAPN RDNAVKFLEY LSSVQAQEYF SAGNDEYPAV 
PGVGLSPSVA ALGIFRPDVI DLSAIGNNVD AAQRVLTAAG WE