Gene Caul_3952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3952
Symbol
ID	5901414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4279190
End bp	4280569
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	69%
IMG OID	641564473
Product	glutamine synthetase catalytic region
Protein accession	YP_001685575
Protein GI	167647912
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0174] Glutamine synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0296195
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATGG TCGCCGATCC CCAGGAATGC CGCGACTTCC TCGCCGCCCA TCCGCAGGTG 
AAGTACGTCG ACGTGTTCTT CACCAGCATG ACCGGCGTGC CCCGTGGGAA ACGCCTCAGG 
ATCCACGAGC TGCAGGCGGT CTACGACTAT GGCCGCTTCC TGCCGGGCTC GATCCTGGTG 
GTCGACACCA ACGGCGCCGA CTGCGAGGAG ACGGGCCTGG TCTGGGAGGA CGGCGACGCC 
GACCGCCGGG CGCGGCCCGT GCCCGGAACC CTGACGCTCG CGCCCTGGCT GGGGCCGGAC 
ATGGCCCAGG TGATGCTGTC GCTGTACGAG CTGGACGGCG CGGCCAACGA CCTGGATCCG 
CGCCATGTGC TCAAGCGCGT GCTGGACCGC TTCGCCGCCG ACGGCCTGAC GCCGGTCGCG 
GCCTGCGAGC TGGAATATTA CCTGGTCGAC CAGCAGCGCG GTCCGAACGG CGAGTTGCTG 
CCGGCCCGGT CGCTGCAGAC CGGCGAGCGG CCCCATGGCA TTCAGGTCTA TGGCCTGCCG 
GAGCTGGAGG CGATCTCGCC GTTCCTGCGC GAGCTGTGGG AGACCTGCGA CGTGCTGGGC 
GTGCCGCTGG AGGGGGCGAT CTCGGAGTTC GCGCCGGGCC AGGTCGAGCT GACCCTCAAG 
CACAAGCCCG ACGCCCTGGC CTGCGCCGAC GACGCCCTGC GCTACAAGCG GGCCGCCAAG 
GGCGTGGCCC TGCGCCATGG ATGCGAGGCC ACCTTCATGG CCAAGCCCTG GGCCGACCAG 
GCCGGCAACG GCTTCCACGT GCATGTCAGC TTCAACGACG CGGCGGGAAA CAACCTGTGC 
GCCGCCGAGG ATCCGGAGGG CTCGGCGCTG CTCAAGCACG CGATCGGCGG CATGAAGGTG 
CTGATGGCCG AGTGCATGGC CATCCTCGCG CCCAACGCCA ACAGCTATCG CCGTTTCAAG 
GCCAACTCCT ACGCGCCCGT CGCCCCGACC TGGGGCGTCA ACAATCGCAC CGTATCCTTG 
CGCGTGCCGG CCGGCCCGCC GCCGACCCGG CATGTGGAGC ACCGCGTGGC CGGCGCCGAC 
GCCAATCCGT ACCTGGTGCT GGCCGTGCTG CTGGCCTGCG CCCACCACGG CATCGCCAAC 
AAGATCGATC CGGGTCCAGC GGTGGTCGGC GACGGCTACG CGGCCGCGGC CAAGGAGAAG 
AGCCGCCTGC CGACCGACTG GTATGCGGCC GTCAACCTGT TCGAAGCCTC CGACGTGCTG 
CGCGACTATC TGGGCGCGCG GTTCGTGGAG ATGTTCGTCT CGGTCAAGCG CACCGAGCAG 
GCGCGCTTCG CCGAGGTGGT CACGTCGCTG GATTATGACT GGTATCTGCG CAACGCGTGA

Protein sequence

MNMVADPQEC RDFLAAHPQV KYVDVFFTSM TGVPRGKRLR IHELQAVYDY GRFLPGSILV 
VDTNGADCEE TGLVWEDGDA DRRARPVPGT LTLAPWLGPD MAQVMLSLYE LDGAANDLDP 
RHVLKRVLDR FAADGLTPVA ACELEYYLVD QQRGPNGELL PARSLQTGER PHGIQVYGLP 
ELEAISPFLR ELWETCDVLG VPLEGAISEF APGQVELTLK HKPDALACAD DALRYKRAAK 
GVALRHGCEA TFMAKPWADQ AGNGFHVHVS FNDAAGNNLC AAEDPEGSAL LKHAIGGMKV 
LMAECMAILA PNANSYRRFK ANSYAPVAPT WGVNNRTVSL RVPAGPPPTR HVEHRVAGAD 
ANPYLVLAVL LACAHHGIAN KIDPGPAVVG DGYAAAAKEK SRLPTDWYAA VNLFEASDVL 
RDYLGARFVE MFVSVKRTEQ ARFAEVVTSL DYDWYLRNA