Gene Spro_2667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_2667
Symbol
ID	5605847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	2936743
End bp	2938305
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	60%
IMG OID	640938206
Product	anthranilate synthase component I
Protein accession	YP_001478896
Protein GI	157370907
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00565] anthranilate synthase component I, proteobacterial subset

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.0000050779
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATGAACA TCAAACCACA ACTCAAATTA CTGAAGGCGG AGGCCAGTTA CCGGGGCGAT 
CCGACCACCA TTTTCCACCA GCTGTGCGGC GCTCGTCCGG CCACCCTGCT GTTGGAATCG 
GCTGAAATCA ACAGCAAGCA AAACCTGCAA AGCCTGTTGG TCATTGACAG CGCTCTGCGC 
ATTACCGCAC TGGGCCGCAC CGTGACGCTG CATGCGCTGA CCGCCAACGG CGCGGCGATG 
CTGCCGCTGC TGGATGAGGC CCTGCCGGCA GAAGTCCAGA ACCAGGTGCG TCCTAATGGA 
CGTGAACTGA CTTTCCCGGT GATTGATGCG ATTCAGGATG AAGATGCCCG CCTGCGTTCG 
CTGTCGGTGT TTGATGCACT GCGCACCCTG CTGACACTGG TTGACTCCCC GGCTGACGAA 
CGTGAAGCAG TGATGCTCGG CGGACTCTTT GCCTACGACT TGGTCGCCGG GTTCGAAGAC 
CTGCCGCCAC TGCGTCAGGA AAACCGCTGC CCGGACTTCT GCTTCTATCT GGCGGAAACC 
TTGTTGGTGC TGGATCATCA ACGCAGCGTT GCCCGTCTTC AGGCCAGCGT TTTCACGGCC 
GATACGGCGG AAGAACAGCG CTTGCAACAG CGCCTGGAGC AGTTGCAGCT GCAATTGAAA 
CAGACCCCAC AGCCGATCCC GCACCAGAAG CTGGAAAACA TGCAACTGAG CTGTAACCAG 
ACCGATGAAG AATACGGTGC GGTTGTCAGC GAATTGCAAC AGGCCATCCG TCAGGGCGAA 
ATCTTCCAGG TGGTGCCGTC GCGCCGTTTC TCGCTGCCGT GCCCGGCCCC GTTGGCCGCT 
TACCAGACGC TGAAGGACAA CAACCCAAGC CCATACATGT TCTATATGCA GGATGACGAG 
TTCACCCTGT TCGGTGCTTC GCCGGAAAGC GCGCTGAAAT ACGACGCCGG CAACCGCCAG 
ATCGAGATCT ACCCGATTGC CGGTACCCGT CCTCGCGGCC GTCGCGCCGA CGGTTCGCTG 
GATCTGGATC TCGACAGCCG TATCGAGCTG GAAATGCGGA CCGATCATAA AGAACTGGCC 
GAGCACCTGA TGCTGGTCGA TCTGGCGCGT AACGATCTGG CGCGCATCTG TCAGGCCGGT 
AGCCGCTATG TGGCCGACCT GACCAAAGTG GACCGCTACT CATTCGTGAT GCACCTGGTG 
TCTCGGGTAA TCGGCACCCT GCGCGCCGAC CTCGACGTGC TGCACGCTTA TCAGGCCTGT 
ATGAACATGG GCACCCTGAG CGGCGCCCCC AAAGTGCGCG CCATGCAGTT AATCGCCGCC 
TCTGAAGGTA CCCGCCGCGG CAGCTACGGC GGTGCGGTCG GTTATTTCAC CGCCACCGGC 
GATTTGGATA CCTGTATTGT CATCCGCTCC GCGTATGTTG AAGACGGCAT TGCTACCGTG 
CAAGCCGGTG CCGGTGTGGT GTTGGATTCT GTTCCTCAGG CGGAAGCCGA TGAGACCCGT 
AATAAGGCAC GTGCCGTGCT GCGTGCCATT GCCAGCGCGC ACCAGGCCAA GGAGGTGTTC 
TGA

Protein sequence

MMNIKPQLKL LKAEASYRGD PTTIFHQLCG ARPATLLLES AEINSKQNLQ SLLVIDSALR 
ITALGRTVTL HALTANGAAM LPLLDEALPA EVQNQVRPNG RELTFPVIDA IQDEDARLRS 
LSVFDALRTL LTLVDSPADE REAVMLGGLF AYDLVAGFED LPPLRQENRC PDFCFYLAET 
LLVLDHQRSV ARLQASVFTA DTAEEQRLQQ RLEQLQLQLK QTPQPIPHQK LENMQLSCNQ 
TDEEYGAVVS ELQQAIRQGE IFQVVPSRRF SLPCPAPLAA YQTLKDNNPS PYMFYMQDDE 
FTLFGASPES ALKYDAGNRQ IEIYPIAGTR PRGRRADGSL DLDLDSRIEL EMRTDHKELA 
EHLMLVDLAR NDLARICQAG SRYVADLTKV DRYSFVMHLV SRVIGTLRAD LDVLHAYQAC 
MNMGTLSGAP KVRAMQLIAA SEGTRRGSYG GAVGYFTATG DLDTCIVIRS AYVEDGIATV 
QAGAGVVLDS VPQAEADETR NKARAVLRAI ASAHQAKEVF