Gene Sbal223_3641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_3641
Symbol
ID	7089575
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	4319891
End bp	4321381
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	47%
IMG OID	643462521
Product	ferredoxin-dependent glutamate synthase
Protein accession	YP_002359542
Protein GI	217974791
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0069] Glutamate synthase domain 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.906462
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.15864
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAAC TCAATTGGTT TATGTGGGGA CTCGATCTGT TTTCAGGACT GTTTTTGATC 
GTTATAGGAC TCGCAGTACT CGCGGTTATT TACATGTATA TCGCAGATAA AATGCAGACC 
AAACAAGCGG TAAGACATAA CTATCCCGTG ATTGGTCGTT TTCGATATCT GTTCGAAAAA 
CAAGGTGAGT TTTTCAGACA ATACTTTTTT GCCCAAGACA GGGAAGAATT GCCCTTCAAC 
CGTGCTGAAC GCAGCTGGGT GTACCGCGCC GCCAAAAATG TCGATAGAAC CATAGCCTTT 
GGTTCGACTC GTCCTTTGGA TACAGCTGGT ACTATTATGT TTATGAATAC CGCCTTCCCA 
ACCCAAGATG AAGATATCAC TCCTATTCAT CCGCTGACGA TTGGCACTCA CTGTCGTCAA 
CCTTATACGA CTCAAGCCAT TTGCCATATT TCAGCCATGA GTTTTGGCGC CCTATCGCGC 
CCAGCCATCA CCGCCCTTTC CCATGGCGCA GCGCAAGCGG GTTGCTGGCT TAATACGGGT 
GAAGGCGGCT TGAGCCCTTA TCATCTCAAA GGTGGCTGCG ATCTCGTCTT TCAAATTGGA 
ACAGCAAAAT ATGGCGTTCG CAATGAACAA GGACATTTAG ACGATGAAAA ACTGAAAGCG 
ATAGCGATTC ATCCTGAAGT CAAAATGTTC GAAATCAAAA TGAGCCAAGG CGCAAAACCT 
GGCAAAGGTG GCATTTTACC CGGTATTAAA GTGACCGCTG AGATTGCCCA TATTCGCGGT 
ATTCCAGAGG GACACGACTC AATCAGCCCC AATGGCCACA TCGAATTTAA GTCAGTAAAC 
GATATTTTAG ATATGGTTGA GCGAGTTCGT GAAGTCACAG GTAAACCTAC CGGCATTAAA 
GCCGTACTCG GCGATGTGCA GTGGCTGGAA GATTTATGTG ATGAAATTGA ACGCCGCGGC 
GAAGACTCCG CCCCCGACTT TTTCACCTTA GACAGCGCCG ATGGTGGCAC AGGCGCAGCA 
CCGCAACCAT TAATGGATTA TGTCGGATTA CCACTGAAAG AAAGCTTACC TATCCTAGTC 
AATATCTTGA TCCAACGCGG CTTGCGTAAA CGCATTAAAG TCATCGCCTC GGGCAAACTT 
ATCGTCCCAT CCAGAGTCGC TTGGGCTTTG GCATTAGGCG CCGACTTTAT CGCATCGGCC 
CGTGGCAACA TGTTCGCCCT CGGTTGTATT CAAGCCTTGC AGTGTAATAA AGATACCTGC 
CCAACGGGTA TCACGACGCA CAATCCAAAA CTACAACAAG GGCTAAATCC TAGGGATAAG 
TCGACTCGGG TCGCTAGCTA TAATCATAAT TTACACCATG ACTTAGGGCT GATCGCGCAC 
TCTTGCGGTG TGACAGAGCC AAGACAGCTC AAGCCTTCAC ATGTACGAAT TGTGCTCGAT 
AGCGGCTTAT CCATCTCACT CGACAAATTC TATTCGCACA TGGATAAATA G

Protein sequence

MSELNWFMWG LDLFSGLFLI VIGLAVLAVI YMYIADKMQT KQAVRHNYPV IGRFRYLFEK 
QGEFFRQYFF AQDREELPFN RAERSWVYRA AKNVDRTIAF GSTRPLDTAG TIMFMNTAFP 
TQDEDITPIH PLTIGTHCRQ PYTTQAICHI SAMSFGALSR PAITALSHGA AQAGCWLNTG 
EGGLSPYHLK GGCDLVFQIG TAKYGVRNEQ GHLDDEKLKA IAIHPEVKMF EIKMSQGAKP 
GKGGILPGIK VTAEIAHIRG IPEGHDSISP NGHIEFKSVN DILDMVERVR EVTGKPTGIK 
AVLGDVQWLE DLCDEIERRG EDSAPDFFTL DSADGGTGAA PQPLMDYVGL PLKESLPILV 
NILIQRGLRK RIKVIASGKL IVPSRVAWAL ALGADFIASA RGNMFALGCI QALQCNKDTC 
PTGITTHNPK LQQGLNPRDK STRVASYNHN LHHDLGLIAH SCGVTEPRQL KPSHVRIVLD 
SGLSISLDKF YSHMDK