Gene Ssed_2359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssed_2359
Symbol
ID	5612970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sediminis HAW-EB3
Kingdom	Bacteria
Replicon accession	NC_009831
Strand	+
Start bp	2872233
End bp	2873642
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	47%
IMG OID	640933270
Product	para-aminobenzoate synthase, subunit I
Protein accession	YP_001474096
Protein GI	157375496
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00205255
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.000900079
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTTTTT CGCCGCAGCA GCAACTTGCT TTCAGGCATC TGAATTGGAA ATACACCACC 
ACAGAACTAT TCTCCCACCT CGCAGACAAG CCCTGGGCCA TGCTGCTCGA CTCGGCAGAT 
GCTGCTCACC TGGATGCAAA ATTTGACATC ATAGTGTGCG ATCCTATCGC GACGATTGTA 
ACCGATGGCC AATCGAGCAG GGTGAATCAT CTACAAGACG GCGAAATAGC AGATAGTCAA 
GTTCACAGTG GTGACCCCTT CACGCTTCTC AATGACACGA TAAATCACTA TTTCCCTCAT 
CAATATCCAA GCCCCTTACC TTTTAGCGGA GGCGCTGTGG GCTGTTTCAG TTACGATTTG 
GGTCGCCAGA TTGAACATCT CCCCCAAATA GCGGCCAGAG ACATTTTACT GCCCGAAATG 
AATGTTGGCT TGTATCCCTG GGCATTAATT TTCGATCGCT TAAACGCGTG CTGGACTCTG 
GCTCATTACC ATGGAGAGGC TCCACTTGAG TCGACTCTGG CACAACTTAA TACCCTGCTC 
GAAGCTAAAC CCAATTCGGT TACCGGTGAC TTCTCCTTAA CCAGTCAATG GATTAATCAG 
ATAACTAAAT CACAATACAT TGAAAAATTT GATAAAATCC AATCCTACCT CAATAGTGGT 
GATTGCTATC AGATAAATCT GACTCAGCGT TTTACCGCAA GCTATCGAGG CGATGAATGG 
CGCGCATACC TCAAGCTGCG TGAGACAAAC AGAGCCCCCT TTTCGGCATT TATCCGATTA 
GATGATGCGG CAATACTCTC TATCTCACCT GAGCGATTTA TTCAGCTTCG TGATGGTCAA 
GTGCAAACAA AGCCCATAAA AGGAACACGG CCTCGATTTG AAAATGCAGA AGCAGACACC 
TCTTCTGCAC TCGAACTCGC CGAATCAGAG AAAGATCGCG CCGAAAACTT AATGATTGTC 
GATCTACTAC GAAATGACAT AGGCAAAGTT GCAAAAGCAG GCTCAGTCAA GGTTCCTCAC 
CTTTTCCAAA TTGACAGTTT TCCAGCCGTC CACCACTTAG TCAGTACGGT AACGGCCGAG 
TTACACAACA AATATCAAGC AACCGACCTG TTAAAAGCGG CTTTTCCCGG TGGCTCTATT 
ACCGGTGCCC CAAAAATCCG TGCGATGCAG ATCATAGAAG AGCTTGAACC CTCGAGGCGC 
AGCCTATATT GTGGGTCTAT TGGCTATATC AGCCAAGATG GACAGATGGA CACCAGTATT 
ACTATTCGCA CATTAGTCGC ACAAGCCAAT CACATACACT GCTGGGCCGG CGGCGGGATT 
GTCGCCGACT CCCAAGCTAA TGATGAATAT CAGGAAACCT TTGATAAGGT CAGTAAGATA 
CTTCCTGTTC TTGAAAAGGT GGATTCTTAA

Protein sequence

MSFSPQQQLA FRHLNWKYTT TELFSHLADK PWAMLLDSAD AAHLDAKFDI IVCDPIATIV 
TDGQSSRVNH LQDGEIADSQ VHSGDPFTLL NDTINHYFPH QYPSPLPFSG GAVGCFSYDL 
GRQIEHLPQI AARDILLPEM NVGLYPWALI FDRLNACWTL AHYHGEAPLE STLAQLNTLL 
EAKPNSVTGD FSLTSQWINQ ITKSQYIEKF DKIQSYLNSG DCYQINLTQR FTASYRGDEW 
RAYLKLRETN RAPFSAFIRL DDAAILSISP ERFIQLRDGQ VQTKPIKGTR PRFENAEADT 
SSALELAESE KDRAENLMIV DLLRNDIGKV AKAGSVKVPH LFQIDSFPAV HHLVSTVTAE 
LHNKYQATDL LKAAFPGGSI TGAPKIRAMQ IIEELEPSRR SLYCGSIGYI SQDGQMDTSI 
TIRTLVAQAN HIHCWAGGGI VADSQANDEY QETFDKVSKI LPVLEKVDS