Gene Caul_4387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4387
Symbol
ID	5901848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4761110
End bp	4762222
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	69%
IMG OID	641564905
Product	glycine cleavage system T protein
Protein accession	YP_001686005
Protein GI	167648342
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0404] Glycine cleavage system T protein (aminomethyltransferase)
TIGRFAM ID	[TIGR00528] glycine cleavage system T protein

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.874222
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.817765
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCGACC AAGATCTCAA GAAGACTCCG CTGTACGACG CGCACGTCGC GGCTGGCGCC 
CGCATGGTGC CGTTCGCCGG CTATTCCATG CCGGTGCAGT ACAAGGACGG GGTGCTGAAG 
GAGCACCTGT GGACCCGCGA GCACGCGGGC CTGTTCGACG TCTCGCACAT GGGTCAGGCC 
CGGCTGCGTG GCGCCAATCC CGCCAAGAGC TTCGAGAAGC TGGTCTCGGC CGACTACCAG 
GGCCTCAAGC CGGGCAAGCA GCGCTATGCG GTGCTGCTGA ACGATCAGGG CGGGGTGATC 
GACGACCTGA TGACGGCGCG TCCCGACGAC GACGGCCTGT TCATCGTCGT CAACGGCGCC 
TGCAAGGACA ACGACTACGC CATCATCGCC AAGGCCCTCG AGGGTGAGGC GACCGTGGAA 
CGGCTGGAGG ACCGCGCCCT GCTGGCCCTG CAGGGCCCCG AGGCCGCCGC CGTGCTGGCC 
GCCCATGTGC CGGAGGCCGC AGGCATGGTG TTCATGGACA CCGCCGCCCT GACCGCCTTC 
GGGACCGACG CCATCATCTC GCGCTCGGGC TATACCGGCG AGGACGGTTA CGAGATCTCG 
GTGCCGGCCA GCGAGGCCGC GCGCATCTGG AACACCCTGC TGCAGGACGA GCGGGTCAAG 
GCGATCGGCC TGGGCGCCCG CGATTCCTTA CGCCTAGAGG CCGGGCTGCC GCTCTACGGC 
CACGACATGG ACGAGACGGT TTCGCCGATC GAGGCCGGCA TGCCGTTCGC CGTCGGCAAG 
AGCCGCCGCG AGGCCGGCGA TTTCCCTGGC GCGGCGCGGA TCCTCAAGGA ACTGGCCGGC 
GACCTCAAGC GCGTCCGCGT CAATCTGAAG GTGCTGGAAG GCGCTCCGGC CCGTGAAGGC 
GCGGAAATCG CCGACGAGAC CGGCGCCGTG GTCGGCGTGG TCACCAGCGG CGGCTTCGGC 
CCCAGCTATG GCGGCGCCAT CGCCATCGGC TTCGTGCCTC CCGCCCTGGC GGTGGTCGGC 
GGGACGCTGA AAGTCATCGT TCGCGGCAAG CCGCAGGCGG CGGAGGTCGT GACCTCGCCG 
TTCGTTCCCA CTCGCTACGT GCGCAAAATC TAA

Protein sequence

MSDQDLKKTP LYDAHVAAGA RMVPFAGYSM PVQYKDGVLK EHLWTREHAG LFDVSHMGQA 
RLRGANPAKS FEKLVSADYQ GLKPGKQRYA VLLNDQGGVI DDLMTARPDD DGLFIVVNGA 
CKDNDYAIIA KALEGEATVE RLEDRALLAL QGPEAAAVLA AHVPEAAGMV FMDTAALTAF 
GTDAIISRSG YTGEDGYEIS VPASEAARIW NTLLQDERVK AIGLGARDSL RLEAGLPLYG 
HDMDETVSPI EAGMPFAVGK SRREAGDFPG AARILKELAG DLKRVRVNLK VLEGAPAREG 
AEIADETGAV VGVVTSGGFG PSYGGAIAIG FVPPALAVVG GTLKVIVRGK PQAAEVVTSP 
FVPTRYVRKI