Gene RoseRS_1455 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1455
Symbol
ID	5208409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	1767944
End bp	1769488
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	63%
IMG OID	640595064
Product	anthranilate synthase component I
Protein accession	YP_001275801
Protein GI	148655596
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.686129
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTGA CCCCATCGCT GAGCGATATG CGCGCACTGG TCGGTCAGGG CAACCTGTGC 
CCGATCTACG CTGAAGTGCT TGCCGACCTG GAGACGCCGG TGTCGGCATT CCTCAAGGTG 
GCGCGTGAAC CGTGGAGTTT TCTGCTTGAG TCAGTTGAGG GCGGGCAGCA TATTGCGCGC 
TACTCGTTTA TCGGCGCAGA ACCATACCTG ACGCTGCGGT TCGATCAGGG GATCGCCAGC 
GCGGTGCAGG GCGGGTACAA GCAGACGTTG CCCTACACTG ATCCGCTCCG GGTGCTGCAC 
TCCTACCTGA GCGCCTACCG TCCGGTGCGC CTGCCCGACC TGCCGCGCTT CGTCGGCGGC 
GCGGTCGGGT ACTTCAGTTA TGAGACGGTC TGCGCCTTCG AGCGCCTGCC GCGCCCGGAG 
AAACGCGGGT ATGCCATGCC CGAAGGGTTG TGGCAATTCG TCGATACGTT GCTGGTGTTC 
GACCATCTGC GCCATAAGAT CAAGGTGCTG ACCCACGTGC ATCTGGACGA TCCGGATCTC 
GAAGGGGCGT ACCGACGCGC CGCGACGCGG ATCGAGGCGT TGATCGAGCG CCTGCGACAA 
CCGCTGCCGA TCCATAATCA GGCGCTTCCG GCATCAGGGC GCGAGATGCC GGATCATACG 
TTTTCTTTCG TGGCAAACTA CGATCCCTGG CCCCCCGATG CACCTGAGCC GGTCGCCGTC 
GCATCGAACG TCACCCGCGA TGAGTACATG CGACGAGTCG AGATCGCCAA GGAGTACATC 
GCAGCTGGCG ACATCTTTCA GGTCGTGCCA TCGCAACGCT TCAGTCGCCC GGTGCGTGTG 
CATCCCTTCG CCATCTACCG CGCCCTGCGG ACGATCAACC CATCGCCGTA TATGTTCTAC 
CTCCACACCC CCGAAGGCGA CCTGGTCGGC GCATCGCCGG AATTGCTGGT GCGCGTCGAG 
GAAGGAGTCG TCACCACCCA TCCGATTGCG GGCACGCGCC GCCGCGGCAA AGACCCCGAA 
GAGGACGCGC GCCTGGCGCA GGAATTGCTG GCAGACGAAA AGGAGCGCGC CGAGCATCTG 
ATGCTCGTCG ATCTGGGACG CAACGACCTG GGGCGCGTGT CGGAACCGGG GACGGTGCGT 
GTATCCTCAT TTATGGAGGT TGAAAAGTTC AGCCATGTCA TGCACCTGGT GAGCCACGTG 
ACGGGCAAAC TGCGCAGCGA TATGACGGCG CTCGACGCGC TGCGGGCGGT GTTTCCCGCC 
GGAACCGTCA GCGGTGCACC GAAGATCCGC GCTATGGAGA TCATTGCCGA ACTCGAAGGT 
GAGCAGCGCG GCGTCTATGC TGGCGCCGTC GGTTACGTCG GCTTCAACGG CGACCTCGAC 
ACCTGCATCG CGCTGCGCAC CATGGTCGTC AAGGATGGGA TCGCCTATGT GCAGGCGGGC 
GGCGGCGTGG TGGCGGACAG CGACCCGGCA GCCGAGTACG AGGAAAGTTG CAATAAGGCG 
GCGGCGCTCC TGCGCGCCAT TGATGCAGCG GAGGGCGAAG TATGA

Protein sequence

MKLTPSLSDM RALVGQGNLC PIYAEVLADL ETPVSAFLKV AREPWSFLLE SVEGGQHIAR 
YSFIGAEPYL TLRFDQGIAS AVQGGYKQTL PYTDPLRVLH SYLSAYRPVR LPDLPRFVGG 
AVGYFSYETV CAFERLPRPE KRGYAMPEGL WQFVDTLLVF DHLRHKIKVL THVHLDDPDL 
EGAYRRAATR IEALIERLRQ PLPIHNQALP ASGREMPDHT FSFVANYDPW PPDAPEPVAV 
ASNVTRDEYM RRVEIAKEYI AAGDIFQVVP SQRFSRPVRV HPFAIYRALR TINPSPYMFY 
LHTPEGDLVG ASPELLVRVE EGVVTTHPIA GTRRRGKDPE EDARLAQELL ADEKERAEHL 
MLVDLGRNDL GRVSEPGTVR VSSFMEVEKF SHVMHLVSHV TGKLRSDMTA LDALRAVFPA 
GTVSGAPKIR AMEIIAELEG EQRGVYAGAV GYVGFNGDLD TCIALRTMVV KDGIAYVQAG 
GGVVADSDPA AEYEESCNKA AALLRAIDAA EGEV