Gene SO_3019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SO_3019
Symbol	trpE
ID	1170706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella oneidensis MR-1
Kingdom	Bacteria
Replicon accession	NC_004347
Strand	+
Start bp	3129858
End bp	3131582
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	50%
IMG OID	637344828
Product	anthranilate synthase component I
Protein accession	NP_718587
Protein GI	24374544
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00565] anthranilate synthase component I, proteobacterial subset

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCTAA AGACATTTAA TCAGGTTACC CAAGCCGATA GAGCGAATTT AGCCTCGTCT 
CAACAGACAT TCGCACGTTC ACATACGCTC AAAGCCACCC TGGTATACCA TAGCGATCCA 
CTGCGTCTGT ACCAGCACAT CACTGAAGAT GCGCCCCATA CCATGTTGTT AGAATCAGCG 
GAAATCAACA GTAAGGAAAA TCTTAAAAGC ATGGTGATGA CCCATGCGGC ACTGATGATC 
CGCTGCGACG GTTATCGTTT ACGCTTTAGC GCACTGACCG ACAATGGTGC CAGTTTGCTC 
ACGCCCATTG AGCAATTTTT TATGGCGCGT TCATGCCATA CACAATGCCA ACGCAATGGC 
CAACACTTAG TGGTGACGCT GCAAAAAGAC ACTGAGCTTA AGGATGAAGA TGCGCGCTTA 
AAATCCACCT CGCCCCTCGA TGGTTTGCGC TTGTTTGTTA AACATATCGA CTGCGGCGCT 
CATACTGACA GCCAATCCAA GCCAGCGTTC GAAGACTTAT TTTTAGGTGG CGTGCTTTCC 
TACGATTTGA TTGATACCGT CGAGCCGCTG CCAGAAGCCC CGAATGGTGC AAATGATTGT 
CCTGATTATT TATTTTATCT CGCCGAAACC TTAATTCTTA TCGATCACAA ACAAAAACAA 
GCCGAGATTA TCACCCACAA CTTCAGTGAA AGCGCAGAAC AACATTCAGA GGTGACCCAA 
GCCTTAGCCG AGCGAGTTGA AAACATCCGC GCCCAATGTG AAGCCTTAGC CAAGAGTGCA 
ACGCCTGCGC CTGCCCTCGT TGGCATAACA GCCACAGAGC AAGTGAATGT CAGTGATGAG 
GCCTTTAAAC AAACTGTTAT CGATTTAAAA GAACACATTA TTGCGGGCGA TATCTTCCAA 
GTGGTGCCTT CTCGCAGTTT TAGCCTGCCC TGCCCGAATA CCTTAGGTGC TTACCGCGCG 
CTGCGTCTAA CCAATCCTAG CCCCTATATG TTTTATTTCA GGGGAAATGA TTTCACCCTG 
TTTGGCGCCT CGCCAGAAAG CGCGCTGAAA TTTGATTCCA GCAACAATCA GGTCGAAGTC 
TATCCAATCG CAGGTACCCG TAAACGCGGC AAAACCGCCA GTGGCGAGAT TGATTTCGAC 
CTCGATAGCC GCATCGAACT CGAACTGCGT TTAGATAAAA AAGAGTTATC TGAACATTTA 
ATGCTGGTCG ATTTGGCTCG CAACGATATC GCCCGAATCA GCCAAAGCGG CAGTCGTAAA 
GTGGCTGAGT TACTTAAAGT CGACCGCTAC TCCCACGTCA TGCACCTTGT GAGCCGCGTC 
ACCGGCCAAT TACGCCAAGA CTTAGATGCG CTCCACGCCT ACCAAGCCTG TATGAACATG 
GGCACTTTAG TTGGCGCGCC CAAAGTTCGT GCTTCGCAAT TAGTGCGTCA GGCAGAAAAG 
ACCCGCCGAG GCAGCTATGG CGGCGCCGTG GGCTACCTCA ATGCCCTTGG CGATATGGAT 
ACCTGCATTG TGATCCGCTC CGCTTTTGTT AAAGACGGTG TAGCCCATAT CCAAGCCGGT 
GCAGGAGTGG TGTTTGACTC CGATCCACAA AGTGAAGCCG ATGAAACCCG CCAAAAGGCG 
CAAGCGGTGA TTTCGGCCAT CAAAATGGGC GCAGGTTTAG CAGGCATAAA TAACTGCAAC 
GAGCACACTT CCACAAAAGT CTCAACAGCA GCGCAGCAAG GATAA

Protein sequence

MTLKTFNQVT QADRANLASS QQTFARSHTL KATLVYHSDP LRLYQHITED APHTMLLESA 
EINSKENLKS MVMTHAALMI RCDGYRLRFS ALTDNGASLL TPIEQFFMAR SCHTQCQRNG 
QHLVVTLQKD TELKDEDARL KSTSPLDGLR LFVKHIDCGA HTDSQSKPAF EDLFLGGVLS 
YDLIDTVEPL PEAPNGANDC PDYLFYLAET LILIDHKQKQ AEIITHNFSE SAEQHSEVTQ 
ALAERVENIR AQCEALAKSA TPAPALVGIT ATEQVNVSDE AFKQTVIDLK EHIIAGDIFQ 
VVPSRSFSLP CPNTLGAYRA LRLTNPSPYM FYFRGNDFTL FGASPESALK FDSSNNQVEV 
YPIAGTRKRG KTASGEIDFD LDSRIELELR LDKKELSEHL MLVDLARNDI ARISQSGSRK 
VAELLKVDRY SHVMHLVSRV TGQLRQDLDA LHAYQACMNM GTLVGAPKVR ASQLVRQAEK 
TRRGSYGGAV GYLNALGDMD TCIVIRSAFV KDGVAHIQAG AGVVFDSDPQ SEADETRQKA 
QAVISAIKMG AGLAGINNCN EHTSTKVSTA AQQG