Gene Sama_1687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_1687
Symbol
ID	4603938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	-
Start bp	2060661
End bp	2062076
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	53%
IMG OID	639781050
Product	para-aminobenzoate synthase, component I
Protein accession	YP_927563
Protein GI	119774823
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.532467
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.427027
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCCAC CCCTGCCCAC TCGTATAAAT CATGCACAGC TCGCCGTAAA AACCCTCGAT 
TGGACCGCAT CCACCAGCGA CATTTTTACC CCATTGGCCA GTCAGCCATG GTCAATGCTG 
CTTGACTCGG CCGATGCACC GCACATGGAC GCCCACTGGG ACATTTTGGT GGCAGCCCCT 
GTCGCTACGT TAAAAGTGTA CGAGAGCCAC TCCGAACTCA CCTATGCAGG CAACACACTG 
AGACTGGACA CCTCTGAGTG CCCTTTTTCA CAGTTGCAAT CGGTCCAGCA TGCACTATTC 
AGCGTTCAAA AAAATACATC ACTCCCCTTC GCCGGTGGCG CATTAGGCAG TTTTAACTAT 
GATTTAGGCA GGCGCATTGA GCGACTACCC AGTACGGCTC TGGACGATAT TAATCTGCCA 
TTAGCCTGTA TTGGCTTTTA CGACTGGGCG CTTATGCGAA GCTATCAATC TGATTCATGG 
CAACTGGTAC ATTATCTCGG TGATGACGCA TTAAACGAGA CACTGGCATG GCTTGAGCAG 
CAGCGCGACT TTGCCCAAGC CGGGGCGGAG TCTAACACCA GCTTCTCGCT GCTGACGGAG 
TTTACCCCCC AAATCACCCG AGACCAGTAC CAGCAAAAAT TCAATCAGGT GCAATCTTAT 
TTGGCGAGTG GTGACTGCTA TCAGATAAAC CTGACCCAAA GGTTCAGCGC TGATTATCAG 
GGAAGCGAGT GGCAGGCCTA CCTCAAACTG CGTTCTGCCA ATGTGGCGCC CTTCTCTGCC 
TTTGTCCGGC TTGAAGAAGG CGCCATTTTG TCCATCTCGC CGGAACGGTT TATCAAACTT 
GACGGCAGAC AGGTGGAAAC CAAGCCTATC AAGGGCACCT TGCCAAGATT GCCCGACCCG 
GACGCCGATA AAACCAATGC CATTTTGCTG AAAGCCTCGC CCAAAGACAG GGCCGAAAAC 
CTGATGATTG TGGATCTGCT GCGAAATGAT ATTGGCCGGG TAGCAAGCCC GGGGAGTGTT 
CGGGTGCCCA AGCTTTTTGA AGTGGAAAGC TTCCCTGCCG TGCATCATTT GGTCAGTACA 
GTAACCGCGC AACTTGCCGA AAACAAAGAT GCCTTTGATT TATTGAGAGC AGCCTTCCCG 
GGCGGCTCTA TTACCGGCGC CCCCAAAATC CGCGCCATGG AAATTATTGA AGAGCTTGAG 
CCATCCCGGC GCAGCATTTA CTGTGGCTCC ATCGGTTATA TCAGCCAGCA CGGTAATATG 
GATACCAGCA TCACCATACG CACCCTGGCG GCTGTCGATG GCAAACTGTA CTGCTGGGCC 
GGTGGGGGCG TGGTGGCCGA CTCAATTGCC GACAGCGAGT ATCAGGAAAC CTTCGACAAG 
ATCAGCCGTA TTCTACCGAT ACTGGAACAG GAATAA

Protein sequence

MFPPLPTRIN HAQLAVKTLD WTASTSDIFT PLASQPWSML LDSADAPHMD AHWDILVAAP 
VATLKVYESH SELTYAGNTL RLDTSECPFS QLQSVQHALF SVQKNTSLPF AGGALGSFNY 
DLGRRIERLP STALDDINLP LACIGFYDWA LMRSYQSDSW QLVHYLGDDA LNETLAWLEQ 
QRDFAQAGAE SNTSFSLLTE FTPQITRDQY QQKFNQVQSY LASGDCYQIN LTQRFSADYQ 
GSEWQAYLKL RSANVAPFSA FVRLEEGAIL SISPERFIKL DGRQVETKPI KGTLPRLPDP 
DADKTNAILL KASPKDRAEN LMIVDLLRND IGRVASPGSV RVPKLFEVES FPAVHHLVST 
VTAQLAENKD AFDLLRAAFP GGSITGAPKI RAMEIIEELE PSRRSIYCGS IGYISQHGNM 
DTSITIRTLA AVDGKLYCWA GGGVVADSIA DSEYQETFDK ISRILPILEQ E