Gene Sbal195_2801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal195_2801
Symbol
ID	5754579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS195
Kingdom	Bacteria
Replicon accession	NC_009997
Strand	+
Start bp	3334320
End bp	3335999
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	49%
IMG OID	641289113
Product	anthranilate synthase component I
Protein accession	YP_001555228
Protein GI	160875912
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00565] anthranilate synthase component I, proteobacterial subset

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.790678
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAAAC AGACATTCGC ACGCTCAAGC ACACTCAAGG CGGCATTAAC CTACCACAGC 
GATCCACTGC GCTTGTATCA GCACATTACC CAAGATGCGC CCCATACTAT GTTGTTGGAG 
TCGGCCGAAA TCGACAGTAA AGATCACTTA AAAAGCATGG TGATGACCCA TGCCGCCATT 
ATGATCCGCT GCGACGGTTA TCAACTGACC TTTACCGCAC TGACCGACAA TGGCGCGAGC 
TTACTTACCC CAATCGAAAC CTTCTTCAGC GCGAGCGGCG ATCGTGCTGA TATGAGTGCC 
AATCTAGTCC GTGATAACTT GACCTTAGTG GTGACACTGC AAAAAGACAC TAAGCTGCAG 
GATGAAGATG CACGCTTAAA ATCTACTTCG CCACTCGATG GCCTACGGAT GTTTATCCAG 
CAAATTGATT GTGGCACTCA TACTGACAGC CAAAGTAAAC CCGCCTTTGA GGATCTGTTT 
TTAGGTGGCG TGTTGGCCTA CGACTTGATT GATACCGTCG AACCGCTGCC AGCCGTACCG 
AACCGCGATA ATGATTGCCC AGACTACTTA TTTTACCTCG CTGAAACCTT AATCCTTATC 
GACCATAAAC TGAAACAAGC CGACATCATT ACCCATAATT TCAGTCGTGA TTCCGCCCAG 
CATACCGCCA TCACCGCAGC GCTGAGCGAG CGAGTTCAGC ATCTAAGCAC ACAATGTAAA 
ACCCTCGGTA ATTCACCTGC CGATGTGCCG ACACTGGTCG CCATCGACGC TACTGAGCAA 
GTCAATATTT CCGATGAGGT GTTCAAACAA ACCGTTATCG ATTTGAAAGA ACACATTATT 
GCGGGCGATA TTTTCCAAGT GGTGCCATCG CGTAGTTTTA GTTTACCTTG CCCGAATACC 
TTAGGGGCTT ATCGCGCCCT GCGTCTAACT AACCCAAGCC CTTACATGTT TTATTTCAGA 
GGCCAAGATT TCACGCTTTT TGGTGCTTCA CCAGAAAGTG CGCTTAAGTA CGAGGCCAGC 
AGCAATCAAG TCGAAGTCTA CCCGATTGCC GGCACCCGCA AACGCGGCAA AACCGCCACG 
GGCGAGATTG ATTTTGACTT AGACAGCCGC ATTGAACTTG AACTGCGTTT AGATAAAAAA 
GAACTGTCAG AACACTTAAT GTTGGTTGAT TTAGCTCGCA ACGATATCGC GCGCATCAGC 
CAAAGCGGCA GCCGTAAAGT CGCTGAATTA TTGAAAGTTG ATCGCTATTC TCACGTGATG 
CACCTTGTCA GTCGCGTAAC GGGTCAATTG CGCCAAGATT TAGATGCGCT GCATGCTTAT 
CAGGCCTGTA TGAATATGGG TACTTTAGTT GGCGCCCCCA AAGTAAGCGC ATCACAACTG 
GTTCGCCAAG CAGAAAAAGC CCGCCGTGGC AGCTACGGCG GCGCTGTGGG TTACCTTAAT 
GCCCTTGGGG ATATGGACAC TTGCATAGTG ATCCGCTCCG CCTTTGTTAA AAATGGTACC 
GCCTTTATTC AAGCGGGCGC GGGCGTGGTA TTTGATTCGG ATCCCCAAAG CGAGGCAGAT 
GAAACCCGTC AAAAAGCCCA AGCCGTGATT TCAGCCATCA AGATGGGCGC TGGACTGCTA 
GCAAATGAAT CGTCAGCTCA ATCCACTTCA GCACAATCCT CTTCAGTGCA ATATAAATAG

Protein sequence

MPKQTFARSS TLKAALTYHS DPLRLYQHIT QDAPHTMLLE SAEIDSKDHL KSMVMTHAAI 
MIRCDGYQLT FTALTDNGAS LLTPIETFFS ASGDRADMSA NLVRDNLTLV VTLQKDTKLQ 
DEDARLKSTS PLDGLRMFIQ QIDCGTHTDS QSKPAFEDLF LGGVLAYDLI DTVEPLPAVP 
NRDNDCPDYL FYLAETLILI DHKLKQADII THNFSRDSAQ HTAITAALSE RVQHLSTQCK 
TLGNSPADVP TLVAIDATEQ VNISDEVFKQ TVIDLKEHII AGDIFQVVPS RSFSLPCPNT 
LGAYRALRLT NPSPYMFYFR GQDFTLFGAS PESALKYEAS SNQVEVYPIA GTRKRGKTAT 
GEIDFDLDSR IELELRLDKK ELSEHLMLVD LARNDIARIS QSGSRKVAEL LKVDRYSHVM 
HLVSRVTGQL RQDLDALHAY QACMNMGTLV GAPKVSASQL VRQAEKARRG SYGGAVGYLN 
ALGDMDTCIV IRSAFVKNGT AFIQAGAGVV FDSDPQSEAD ETRQKAQAVI SAIKMGAGLL 
ANESSAQSTS AQSSSVQYK