Gene Sbal223_1664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_1664
Symbol
ID	7086270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	-
Start bp	1944918
End bp	1946612
Gene Length	1695 bp
Protein Length	564 aa
Translation table	11
GC content	50%
IMG OID	643460565
Product	anthranilate synthase component I
Protein accession	YP_002357592
Protein GI	217972841
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00565] anthranilate synthase component I, proteobacterial subset

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00684906
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0000845967
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCAAAC AGACATTCGC ACGCTCAAGC ACACTCAAGG CGGCATTAAC CTACCACAGC 
GATCCACTGC GCTTGTATCA GCACATGACC CAAGATGCGC CCCATACTAT GTTGTTGGAG 
TCGGCCGAAA TCGACAGTAA AGATCACTTA AAAAGCATGG TGATGACCCA TGCCGCCATG 
ATGATCCGCT GCGACGGTTA TCAACTGACC TTTACCGCAC TGACCGACAA TGGCGCGAGC 
TTACTTACCC CAATCGAAAC CTTCTTCAGC GAGAGCGGCG ATCGTGCTGA TATGAGTGCC 
AATCTAGTCC GTGATAACTT GACCTTAGTG GTGACACTGC AAAAAGACAC TAAGCTGCAG 
GATGAAGATG CACGCTTAAA ATCTACCTCG CCACTCGATG GCCTACGGAT GTTTATCCAG 
CAAATTGATT GTGGCACTCA TACTGACAGC CAAAGTAAAC CCGCCTTTGA GGATCTGTTT 
TTAGGTGGCG TGCTGGCCTA CGACTTGATT GATACCGTCG AACCACTGCC AGCCGTGCCG 
AACCGCGATA ATGATTGTCC AGACTACTTA TTCTACCTCG CTGAAACCTT AATCCTTATT 
GACCATAAAC TAAAACAAGC CGACATCATT ACCCATAATT TCAGCCGTGA TTCAGTCCAG 
TATGCCGCCA TCACCGCAGC GCTGAGCGAG CGAGTACAGC TGTTAAGCAC CCAATGTAAA 
ACTCTGGGTA ATTCACCTGC CGATGTGCCG ACACTGGTCG CCATCGACGC TACTGAGCAA 
GTCAATATTT CCGATGAGGT GTTCAAACAA ACCGTTATCG ATTTGAAAGA ACACATTATT 
GCGGGCGATA TTTTCCAAGT GGTGCCATCG CGTAGCTTTA GTTTACCTTG CCCGAATACC 
TTAGGGGCTT ATCGCGCCCT TCGTCTAACT AACCCAAGCC CTTACATGTT TTATTTCAGG 
GGCCAAGATT TCACGCTTTT TGGTGCTTCA CCAGAAAGCG CGCTTAAATA CGAGGCCAGC 
AGCAATCAAG TCGAAGTCTA CCCGATTGCT GGCACCCGCA AACGCGGCAA AACCGCCACG 
GGCGAGATTG ATTTTGACTT AGACAGCCGT ATTGAACTTG AACTGCGTTT AGATAAAAAA 
GAACTGTCAG AACACTTAAT GTTGGTCGAT TTAGCTCGCA ACGATATCGC GCGTATCAGC 
CAAAGCGGCA GCCGTAAAGT CGCCGAATTA TTGAAAGTGG ACCGTTATTC CCACGTGATG 
CACCTCGTCA GTCGCGTAAC GGGTCAACTG CGCCAAGATT TAGATGCGCT GCATGCTTAT 
CAGGCGTGTA TGAATATGGG CACTTTAGTT GGCGCGCCCA AAGTAAGCGC ATCACAACTG 
GTTCGCCAAG CGGAAAAAGC CCGCCGCGGC AGCTACGGCG GCGCTGTGGG TTACCTTAAT 
GCTCTTGGTG ATATGGACAC CTGTATTGTG ATCCGCTCGG CCTTTGTTAA AAATGGCACC 
GCCTTTATTC AAGCGGGCGC GGGCGTCGTG TTTGATTCGG ATCCCCAAAG TGAGGCTGAC 
GAAACCCGTC AAAAAGCCCA AGCCGTGATT TCGGCCATCA AAATGGGCGC TGGACTGCGA 
GTCAATGAAT CGCCAGCAAA TGACGCGTCG GCTCAATCCA CTTTTGTGCA ATCCACTTCA 
GTACAATCTA AATAG

Protein sequence

MPKQTFARSS TLKAALTYHS DPLRLYQHMT QDAPHTMLLE SAEIDSKDHL KSMVMTHAAM 
MIRCDGYQLT FTALTDNGAS LLTPIETFFS ESGDRADMSA NLVRDNLTLV VTLQKDTKLQ 
DEDARLKSTS PLDGLRMFIQ QIDCGTHTDS QSKPAFEDLF LGGVLAYDLI DTVEPLPAVP 
NRDNDCPDYL FYLAETLILI DHKLKQADII THNFSRDSVQ YAAITAALSE RVQLLSTQCK 
TLGNSPADVP TLVAIDATEQ VNISDEVFKQ TVIDLKEHII AGDIFQVVPS RSFSLPCPNT 
LGAYRALRLT NPSPYMFYFR GQDFTLFGAS PESALKYEAS SNQVEVYPIA GTRKRGKTAT 
GEIDFDLDSR IELELRLDKK ELSEHLMLVD LARNDIARIS QSGSRKVAEL LKVDRYSHVM 
HLVSRVTGQL RQDLDALHAY QACMNMGTLV GAPKVSASQL VRQAEKARRG SYGGAVGYLN 
ALGDMDTCIV IRSAFVKNGT AFIQAGAGVV FDSDPQSEAD ETRQKAQAVI SAIKMGAGLR 
VNESPANDAS AQSTFVQSTS VQSK