Gene Strop_1231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1231
Symbol
ID	5057681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	1389105
End bp	1391021
Gene Length	1917 bp
Protein Length	638 aa
Translation table	11
GC content	70%
IMG OID	640473500
Product	dihydroxy-acid dehydratase
Protein accession	YP_001158079
Protein GI	145593782
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00143562
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.953695
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTGCATCT GTTGGGACAC GTCCTGCGCG GGCTCGGGTC GAACTCGCGA CGGTGTCAGA 
CTGGTATGCA TGCCTGAGCT GCGGTCGAGG ACCTCCACCC ACGGTCGGAC GATGGCGGGC 
GCCCGAGCCC TGTGGCGGGC CACCGGGATG ACCGACGACG ACTTCGGCAA GCCGATCGTC 
GCCATCGCCA ACAGCTTCAC CCAGTTCGTT CCGGGGCATG TCCACCTCAA GGAGCTCGGT 
GGCCTGGTGG CCGAGGCGGT AGCCGATTCC GGCGGGGTGG GTCGGGAGTT CAACACCATC 
GCCGTGGACG ACGGCATCGC GATGGGCCAC GGCGGCATGC TCTACTCGCT GCCAAGCCGG 
GAACTGATCG CCGACGCCGT GGAGTACATG GTCAATGCCC ACTGCGCCGA CGCCCTGGTC 
TGCATCTCCA ACTGCGACAA GATCACTCCC GGGATGCTGC TGGCCGCGCT GCGGCTGAAC 
ATCCCAACTG TCTTCGTCTC CGGCGGCCCG ATGGAGGCCG GCAAGACCGT CGCGATCGAG 
GGGGTCGTAC ACTCCAAGAT CGACCTGATC GATGCGATGA TCGCTGCGTC CAACGAGGCG 
GTCACCGACG ACCAGCTCGG CCAGATCGAA CGCTCGGCCT GCCCCACCTG CGGCTCCTGC 
TCCGGCATGT TCACCGCCAA CTCGATGAAC TGCCTCACCG AGGCGATCGG CCTGGCCCTT 
CCCGGCAACG GGTCAACGCT GGCGACCCAC GCCGCCCGCC GGTCACTCTT CGTCGAGGCC 
GGCCGCACCG TCGTCGAGAT CGCCAAGCGT TGGTACGACG GGGACGACGC CACGGTGCTG 
CCCCGTGCGG TAGCCAACCG CGCCGCCTTC GACAACGCGG TCGCCCTCGA CGTCGCGATG 
GGCGGTTCGA CGAACACCAT CCTGCACCTG CTGGCCGCCG CCCGCGAGGC CGAGCTGGAC 
TTCGGGGTGG TGGACATCGA CGCCATCTCC CGGCGGGTGC CCTGCCTGGC GAAGGTCGCA 
CCGAACTCTC CCCACTACCA CATGGAGGAC GTCCACCGGG CCGGTGGCAT CCCGGCCATC 
CTCGGTGAGC TGGACCGCGC CGGCCTACTC AACCGGGAGG TCCACGCGGT GCACTCCCCC 
TCGCTGGAGC GCTGGCTCGC CGACTGGGAC GTTCGGGGTG GCACCGCGAC ACCGACGGCG 
GTCGAGCTGT TCCATGCCGC ACCGGGCGGG GTCCGCACCG TCGAGCCGTT CTCCACCACC 
AACCGCTGGT CGACACTGGA CACAGATGCG GCCGACGGCT GCGTACGGGA GCGGGCCCAC 
GCGTACACCG CGGACGGAGG GCTGGCCATC CTGCACGGCA ACCTGGCACC GGAGGGCTGC 
GTGGTGAAGA CCGCCGGGGT ACCCGAGGAG TGCCTGACCT TCCGCGGCCC CGCCAAGGTC 
TACGAGTCCC AGGACGACGC GGTCACCGCC ATCCTGGCCA AGGAGGTCGT CGCCGGCGAC 
GTGGTGGTGA TCCGCTACGA GGGCCCCCGG GGTGGGCCCG GGATGCAGGA GATGCTCTAC 
CCCACCTCGT TCCTCAAGGG CCGAGGGCTG GGGCGGGCCT GCGCGCTACT GACCGACGGC 
CGCTTCTCCG GCGGCACCTC CGGACTGTCC GTCGGGCACG TCTCCCCGGA GGCCGCCGCC 
GGTGGGCTGA TCGCCCTGGT CGAACCGGGC GACGAGATCG TCATCGACAT CCCGAACCGG 
GCCATCGAAT TGGCCGTACC GGCCGAGGTG TTGGACGCCC GCCGGGTCGC ACAGGAGAAG 
CGAGACCGCC CGTACACGCC GGCGGAGCGG CAGCGCCCCG TCTCCGCAGC GCTGCGCGCG 
TACGCCGCCA TGACCACCTC GGCCAGCGAC GGCGCCTACC GCCGCGTCCC CGAGTGA

Protein sequence

MCICWDTSCA GSGRTRDGVR LVCMPELRSR TSTHGRTMAG ARALWRATGM TDDDFGKPIV 
AIANSFTQFV PGHVHLKELG GLVAEAVADS GGVGREFNTI AVDDGIAMGH GGMLYSLPSR 
ELIADAVEYM VNAHCADALV CISNCDKITP GMLLAALRLN IPTVFVSGGP MEAGKTVAIE 
GVVHSKIDLI DAMIAASNEA VTDDQLGQIE RSACPTCGSC SGMFTANSMN CLTEAIGLAL 
PGNGSTLATH AARRSLFVEA GRTVVEIAKR WYDGDDATVL PRAVANRAAF DNAVALDVAM 
GGSTNTILHL LAAAREAELD FGVVDIDAIS RRVPCLAKVA PNSPHYHMED VHRAGGIPAI 
LGELDRAGLL NREVHAVHSP SLERWLADWD VRGGTATPTA VELFHAAPGG VRTVEPFSTT 
NRWSTLDTDA ADGCVRERAH AYTADGGLAI LHGNLAPEGC VVKTAGVPEE CLTFRGPAKV 
YESQDDAVTA ILAKEVVAGD VVVIRYEGPR GGPGMQEMLY PTSFLKGRGL GRACALLTDG 
RFSGGTSGLS VGHVSPEAAA GGLIALVEPG DEIVIDIPNR AIELAVPAEV LDARRVAQEK 
RDRPYTPAER QRPVSAALRA YAAMTTSASD GAYRRVPE