Gene Dshi_1371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1371
Symbol
ID	5712547
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	1424219
End bp	1425220
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	67%
IMG OID	641267283
Product	ABC transporter related
Protein accession	YP_001532714
Protein GI	159043920
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1116] ABC-type nitrate/sulfonate/bicarbonate transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.138832
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCAGTC GCGAAGAAAT CGACGGGTTC GACCACAGCC CAGAGCCACC GAAACCCGCG 
CCCGCACGCG CGCCGAAGGT CACCCCGTCG CAGCCCCTTG CGGGGGAGGC GGACCTGGCC 
AGCCGCAAGG GCAATTGGCG CTACCTCGCG CCGGAGGCCG CGGCGCCCCA GGCCGACGCC 
GAGGCACCGG CCGCGGCGCC CGAGCCGACG CGCGCGACGG ATGCGCCTGC GACCGTGATC 
TCGGCGCGGG ATCTGGACCT GGTGTTCCAG ACCAACGATG GTCCGGTTCA TGCGCTGTCG 
GGCGTCAATC TTGAGATCGG CAAGGGCGAG TTCGTCAGCT TTATCGGCCC CTCGGGCTGC 
GGCAAGACCA CCTTCCTGCG CGCGGTCGCA GGGCTGGAGC ATCCCACGGG CGGCTCGCTC 
ACGGTCAATG GCATGACCCC GGACGAGGCC CGGCAGGCCC GCGCCTATGG CTACGTCTTC 
CAGGCGGCGG GGCTTTATCC GTGGCGCACC ATCGCCAAGA ATATCTCCCT GCCGCTTCAG 
ATCATGGGCT ATTCCAAGGC CGATCAGGAG GCGCGCGTTG CCCGCGTGCT GGAGTTGGTG 
GAGTTGTCGG GCTTTGCCAA GAAATACCCC TGGCAGCTGT CGGGGGGCAT GCAGCAACGC 
GCGTCCATCG CGCGGGCGCT GTCCTTCGAT GCCGATATCC TGCTGATGGA CGAACCCTTC 
GGAGCGTTGG ACGAGATCGT GCGCGACCAC CTCAACGAGC AGTTGCTCGC CCTGTGGAAG 
CGCACCGAGA AGACCATCGG CTTCGTCACC CATTCGATCC CCGAGGCGGT CTATCTCAGC 
ACCAAGATCG TGGTGATGTC CCCGCGCCCG GGCCGGATCA CGGATGTGAT CGACAGCCCG 
CTCCCCCTCG ACCGCCCGCT CGACATCCGC GACACGCCGG AATTCATCGA GATTGCCCAC 
CGCGTCCGCG AGGGCCTTCG GGCGGGGCAT CTGGATGAGT AG

Protein sequence

MLSREEIDGF DHSPEPPKPA PARAPKVTPS QPLAGEADLA SRKGNWRYLA PEAAAPQADA 
EAPAAAPEPT RATDAPATVI SARDLDLVFQ TNDGPVHALS GVNLEIGKGE FVSFIGPSGC 
GKTTFLRAVA GLEHPTGGSL TVNGMTPDEA RQARAYGYVF QAAGLYPWRT IAKNISLPLQ 
IMGYSKADQE ARVARVLELV ELSGFAKKYP WQLSGGMQQR ASIARALSFD ADILLMDEPF 
GALDEIVRDH LNEQLLALWK RTEKTIGFVT HSIPEAVYLS TKIVVMSPRP GRITDVIDSP 
LPLDRPLDIR DTPEFIEIAH RVREGLRAGH LDE