Gene Sbal223_2376 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_2376
Symbol
ID	7089339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	2838092
End bp	2839504
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	50%
IMG OID	643461270
Product	para-aminobenzoate synthase, subunit I
Protein accession	YP_002358294
Protein GI	217973543
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000419879
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.281774
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATTA GGGCGTCAAA ACAGCTTGCA TCACGCCAAC TTGACTGGAC ATTTAGCACC 
GCAGCACTGT TCGAACACTT TGCCAATGAC CCATGGGCAA TCCTGTTAGA TTCGGCGAAC 
GCGCCGCATC AGGACGCCAG ATTCGACATC ATTTGCGCCA ATCCCATCGC AACATTAGTG 
ACTCAGGGCA AGCGTAGCGA TATAAAGCTC ATCGATACGA GCTTGAGCTT ACCCGAGGCG 
ATGGACCCAA ACCGTGATCC CTTCGACCTG CTCAACACTT TATTAAATCA TTGGTATTCA 
AAATCTTTTG ATTGCATTCT GCCCTTCAGT GGCGGCGCAA TGGGCAGCTT TAGTTACGAC 
TTAGGCCGTC GCATCGAATC CCTGCCAACA AGCGCTCAGC AAGATATTCA ACTGCCAGAG 
ATGAACATCG GCTTTTACGA CTGGGCGTTA GTTTATGATT ACCAAGCCCA GTGTTGGCAT 
TTATTGCATT ATTTAGGTGA AGCGGCACTC GACATCGAAT TGAATAAAAT TCAAGCGAAA 
ATAGCGCATA AGCCAAATAC CGCCGAATTC ATGCTCATAG GCCCATGGAC TGCACAAATC 
GATAAAGCCC AATACAAGGC AAAATTTGAG GCGGTACAAG CCTATTTGCA CAGCGGCGAT 
TGCTATCAAA TAAATTTATC CCAACGATTT GAAGCTGGCT ATCAAGGCGA CGAATGGTCA 
GCTTATTGCC AACTGCGTAA TGCCAATAAA GCGCCCTTCT CGGCCTTTAT GCGTCTGCCA 
CATAACGCAA TTTTATCAAT TTCACCTGAG CGTTTTATTC AACTTCGCGG TGATGATATT 
CAGACTAAAC CCATCAAAGG CACGCTGCCG CGTCACGCGG ATCCCGCGCT CGACGCCAAA 
GCCGCGAGAA CCCTTGCCAG CTCGCCAAAG GATCGCGCCG AAAATGTCAT GATTGTCGAC 
TTGCTGCGTA ATGATATCGG CAAAGTAGCG TCGGCAGGCT CGGTACGTGT ACCGCATCTG 
TTTGAGATTG AAAGCTTTCC TGCGGTGCAT CACCTTGTCA GTACAGTGAC GGCCAAGCTC 
GATGCTAAGT ACAGCGCCAG CGATTTGCTG CGCGCAGCGT TCCCAGGCGG CTCAATTACC 
GGCGCACCGA AAATCCGCGC CATGGAAATT ATTGAAGAGC TCGAACCTTC ACGGCGCAGT 
CTTTACTGTG GCTCTATGGG CTATATCAGC CAAGATGGCC AAATGGATAC CAGTATCACC 
ATTCGCACTA TTGTGGCCGA ACAGGGCAAA CTCTATTGCT GGGCGGGCGG CGGCATAGTG 
GCAGATTCAG AAGTGAATGC CGAGTACCAA GAAACCTTTG ATAAGATCAG CCGGATTTTG 
CCTTTACTTG GCGCAGAGCC GCAAAAGCCG TAA

Protein sequence

MAIRASKQLA SRQLDWTFST AALFEHFAND PWAILLDSAN APHQDARFDI ICANPIATLV 
TQGKRSDIKL IDTSLSLPEA MDPNRDPFDL LNTLLNHWYS KSFDCILPFS GGAMGSFSYD 
LGRRIESLPT SAQQDIQLPE MNIGFYDWAL VYDYQAQCWH LLHYLGEAAL DIELNKIQAK 
IAHKPNTAEF MLIGPWTAQI DKAQYKAKFE AVQAYLHSGD CYQINLSQRF EAGYQGDEWS 
AYCQLRNANK APFSAFMRLP HNAILSISPE RFIQLRGDDI QTKPIKGTLP RHADPALDAK 
AARTLASSPK DRAENVMIVD LLRNDIGKVA SAGSVRVPHL FEIESFPAVH HLVSTVTAKL 
DAKYSASDLL RAAFPGGSIT GAPKIRAMEI IEELEPSRRS LYCGSMGYIS QDGQMDTSIT 
IRTIVAEQGK LYCWAGGGIV ADSEVNAEYQ ETFDKISRIL PLLGAEPQKP