Gene Anae109_0376 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_0376
Symbol
ID	5376923
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	428232
End bp	429713
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	75%
IMG OID	640841885
Product	anthranilate synthase component I
Protein accession	YP_001377575
Protein GI	153003250
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.957074
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.0417216
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGGTGC GCGTCGAGGT CGACGCCGAC ACCGAGACGC CGGTCTCCGC GTTCCTGAAG 
CTCTCCCGCG GCGAGCGGCA GGCGTTCCTG CTCGAGTCGG TCGAGGGCGG CGAGCGCAGC 
GCGCGGTTCA GCTTCCTCGG CGCCGGCCCC AAGAGCGTGC TGCGCCACAA GCTCGGCGAT 
CGCGGCGACC CCCTCGCCGC GGTGCGCGCC GCGCTCGCCA CGCACACGGC CGTGCGCGTC 
CCGGGCACGC CCCGCTTCGC GGGCGGGCTG GTCGGGCACG TCGGCTACGA CGCGGTGAAG 
CTGTTCGAGC CGCGCGTGCC GATCGCGAAC CCGGACGAGC TCGGGTTCCC CGACCTGCTG 
CTCATGGACT TCGACGAGGT GGTGGCGTTC GACAACCGGC GCCACTCGCT GCACGTCATC 
TGCGAGGTCC GCTGCGACGA GGGCGACGAT CCCCGGGCGC TCTACGCGCG CGCCGTGAAG 
CGCATCCGGG CGCGGCTCGC GCTCCTCGCC GCCCCGCTCG AGGACCGCCG GGCGCGGCGC 
GCCGCGAAGC CGTCCGAGCT CGTCCCCCGC GTGGCGAAGC CCGACTACCT CGCCGCGGTC 
GAGCGCGCGA AGGACTACGT CCGGGCCGGG GACTGCCAGC AGATCGTGCT CTCGCAGCGC 
TTCGACGCCG AGGTCTCGGT CCCGCCGTTC GAGATCTACC GCGCGCTGCG GCGCGTGAAC 
CCCTCGCCGT ACCTGTTCTT CCTGAAGGAC GGGGAGCGCG CCCTCGTCGG CTCCTCGCCC 
GAGACGCTCA TCAAGCTCGA GGACGGCGAG GTGACGCTCC GGCCCATCGC GGGCACGCGC 
AAGCGCGGCG GGGACGCGGC GGAGGACGCG CGGCTCGAGG CGGAGCTGCG CGCCGACCCG 
AAGGAGAACG CCGAGCACGT CATGCTCGTG GACCTCGGCC GCAACGACGT CGGCCGCGTC 
TCCGCGGTGG GCAGCGTGCG CGTCACCGCG CTCAAGACCG TGGAGCGGTA CTCGCACGTC 
ATGCACCTCG TCTCGGAGGT GAAGGGCAGG CTCGCCGCCG GCCTCGGCGC GGTGGACGTG 
CTGCGGGCGG GCTTCCCCGC CGGCACGGTC TCCGGCTCGC CCAAGGTGCG GGCGATGGAG 
ATCATCGACG AGCTGGAGCC GGCGCGGCGG GGACCCTACG CCGGCGCGGT CGGCTACTTC 
GACCGCGGCG GCGACATGGA GATGTGCATC GCCATCCGCA CGCTCATGGC GCGCGGCAGG 
CGCGTGTCGG TCCAGGCGGG CGGCGGCCTC GTGTACGACT CCGACCCCGA GGCGGAGTAC 
CAGGAGACCC TCAACAAGGC GCGCGCGGTG TTCACGGCGG TGGCCCAGGC CGAGTCTCGC 
GTGCTCGACG CCGTCGCGCG GCCCCCGGCC CCGGCGGCGC GCACCGTGGC GGCGCGCACG 
CCGAAGGCGA GCCGGCGCCG GCCGCGCAGG GGCGAGCGAT GA

Protein sequence

MPVRVEVDAD TETPVSAFLK LSRGERQAFL LESVEGGERS ARFSFLGAGP KSVLRHKLGD 
RGDPLAAVRA ALATHTAVRV PGTPRFAGGL VGHVGYDAVK LFEPRVPIAN PDELGFPDLL 
LMDFDEVVAF DNRRHSLHVI CEVRCDEGDD PRALYARAVK RIRARLALLA APLEDRRARR 
AAKPSELVPR VAKPDYLAAV ERAKDYVRAG DCQQIVLSQR FDAEVSVPPF EIYRALRRVN 
PSPYLFFLKD GERALVGSSP ETLIKLEDGE VTLRPIAGTR KRGGDAAEDA RLEAELRADP 
KENAEHVMLV DLGRNDVGRV SAVGSVRVTA LKTVERYSHV MHLVSEVKGR LAAGLGAVDV 
LRAGFPAGTV SGSPKVRAME IIDELEPARR GPYAGAVGYF DRGGDMEMCI AIRTLMARGR 
RVSVQAGGGL VYDSDPEAEY QETLNKARAV FTAVAQAESR VLDAVARPPA PAARTVAART 
PKASRRRPRR GER