Gene Smed_1786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1786
Symbol
ID	5322644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1868368
End bp	1870419
Gene Length	2052 bp
Protein Length	683 aa
Translation table	11
GC content	60%
IMG OID	640790724
Product	ferredoxin
Protein accession	YP_001327456
Protein GI	150396989
COG category	[R] General function prediction only
COG ID	[COG3894] Uncharacterized metal-binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00262051
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTGAACG TGCCTTCGAA GGACGAAAAG AACGAACCGC TGGTGCTCTT CATGCCATCG 
GGCAAACGCG GCCGCTTCCC GGTTGGCACG CCGATCCTCG ATGCCGCTCG CTCGCTCGGG 
GTCTATGTCG AAAGCGTCTG CGGCGGTCGC GCCACCTGCG GGCGGTGCCA GGTGTCCGTC 
CAGGAAGGCA ATTTCGCCAA GCACAAAATC GTCTCTTCCA ACGACCATAT CTCGCCATTC 
GGGCCCAAGG AGCAGCGTTA CGCCAGCGTA CGTCAATTGC CCGACGGCCG CCGCCTATCG 
TGCTCGGCCC AGATCCTCGG CGATCTCGTC ATAGACGTGC CGCAGGACAC AGTCATCAAC 
GCTCAGGTGG TGCGCAAGGC CGCGACCGAC CGCGTTATCG AGCGCAATGC TGCAGTACAA 
CTGTGTTATG TCGAAATCGA CGAGCCGGAT ATGCACAAGC CGCTCGGCGA TTTCGATCGG 
ATGAAGGCCG TATTGGAGAA AGACTGGGGC TGGAAGGATC TCCTGATCGC TCCACACCTC 
ATCCCACAGG TGCAAGGCAT ATTGCGCAAG GGAAATTGGA CGGTGACCGC AGCAATCCAC 
CGCGACATGG ATTCCTCCCG TCCCTTTATC GTCGGGCTAT GGCCGGGGCT GAAGAACGAG 
GCATATGGCG TCGCCTGCGA CATCGGCTCG ACGACGATTG CGATGCATCT CGTATCGCTG 
CTGTCCGGAC GTATAGCCGC CTCCTCGGGA ACCTCGAATC CGCAGATCCG CTTTGGTGAG 
GATCTGATGA GCCGCGTTTC TTACGTGATG ATGAACCCGG ATGGCCGGGA GGCAATGACC 
AAGGCCGTGC GCGACGCCGT GAACGACCTC ATCGGCAAGG TTTGCGCCGA AGGCGAGGTC 
GATCGCCACG ACATCCTCGA TCTGGTCTTC GTCGGCAATC CGATCATGCA TCATCTGTTT 
CTCGGGATTG ATCCGACAGA ACTCGGACAG GCACCATTTG CCCTCGCCGT CTCCGGTGCC 
CTACAATATT GGGCGCATGA GATCGACATC GAGGTCAACC GCGGCGCGCG CATCTATATG 
CTTCCCTGTA TCGCCGGCCA TGTCGGAGCG GATGCCGCAG GTGCGACACT TTCCGAAGGG 
CCGCACCGCC AGGACAACAT GATGCTGCTG GTCGACGTAG GGACCAATGC CGAAATCGTA 
CTCGGCAACA AGGAGCGCGT CGTCGCGGCC TCCTCGCCGA CCGGCCCGGC GTTTGAAGGG 
GCCGAGATTT CTTCCGGACA ACGTGCAGCA CCAGGGGCGA TCGAGCGCGT GCGCATCGAT 
CCCGAGACTT TGGAGCCGCG GTTCCGGGTG ATCGGTGTCG ATAAATGGTC GGACGAAGAA 
GGTTTCGCCG AAGCCGCCGC GGCAGTCGGT GTAACTGGAA TCTGCGGCTC GGCGATTATC 
GAGGTCGTGG CGGAGATGTA CCTCACGGGC ATCATTTCGC AGGACGGCGT CGTCGACGGC 
GCAATGGCGG CGAAAAGCCC CCGCATCATC CCGAACGGCC GCACCTTTTC CTACCTACTG 
CACGATGGCG CACAACGAAT CACCGTGACG CAGAACGACA TCAGGGCGAT CCAGCTCGCC 
AAGTCGGCGC TCTATGCCGG AATTAAGCTG CTCATGGAGA AACAGGGCGT CGATCACGTC 
GACACGATCC GGTTTGCCGG CGCCTTCGGC TCCTTCATCG ATCCAAAATA TGCCATGGTG 
CTGGGCCTGA TACCCGATTG CGACCTCACG GAAGTGAAGG CGGTTGGCAA TGCCGCCGGC 
ACCGGCGCGC TGATGGCGCT CCTCAATCGC GGACACCGTC GCGAAATCGA GCAAACCGTG 
AGGAAAATCG AGAAGATAGA GACGGCGCTT GAATCAAAAT TTCAGGAGCA TTTCGTCAAC 
GCAATGGCGA TGCCGAACAA GGTGGATGCC TTCCCGAAAC TCGCCGAAGT GGTTACCTTG 
CCGGCACGCA AGGTGCTGAC CGATGACGGT GGCGACGGAA GTGGACGCAG ACGGCGACGC 
AACAGGGAAT AG

Protein sequence

MLNVPSKDEK NEPLVLFMPS GKRGRFPVGT PILDAARSLG VYVESVCGGR ATCGRCQVSV 
QEGNFAKHKI VSSNDHISPF GPKEQRYASV RQLPDGRRLS CSAQILGDLV IDVPQDTVIN 
AQVVRKAATD RVIERNAAVQ LCYVEIDEPD MHKPLGDFDR MKAVLEKDWG WKDLLIAPHL 
IPQVQGILRK GNWTVTAAIH RDMDSSRPFI VGLWPGLKNE AYGVACDIGS TTIAMHLVSL 
LSGRIAASSG TSNPQIRFGE DLMSRVSYVM MNPDGREAMT KAVRDAVNDL IGKVCAEGEV 
DRHDILDLVF VGNPIMHHLF LGIDPTELGQ APFALAVSGA LQYWAHEIDI EVNRGARIYM 
LPCIAGHVGA DAAGATLSEG PHRQDNMMLL VDVGTNAEIV LGNKERVVAA SSPTGPAFEG 
AEISSGQRAA PGAIERVRID PETLEPRFRV IGVDKWSDEE GFAEAAAAVG VTGICGSAII 
EVVAEMYLTG IISQDGVVDG AMAAKSPRII PNGRTFSYLL HDGAQRITVT QNDIRAIQLA 
KSALYAGIKL LMEKQGVDHV DTIRFAGAFG SFIDPKYAMV LGLIPDCDLT EVKAVGNAAG 
TGALMALLNR GHRREIEQTV RKIEKIETAL ESKFQEHFVN AMAMPNKVDA FPKLAEVVTL 
PARKVLTDDG GDGSGRRRRR NRE