Gene Caul_4843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4843
Symbol
ID	5902305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	5240470
End bp	5241588
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	69%
IMG OID	641565363
Product	AFG1 family ATPase
Protein accession	YP_001686461
Protein GI	167648798
COG category	[R] General function prediction only
COG ID	[COG1485] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.826609
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTACAT CCGTCCGCAC CGCCTATCGT GAACGCCTGG CCCAGGGCGA GATCAAGCCC 
GACGCCGCCC AGGCCGCCGC GGTCGACGCC CTGTCGCGGC TGGAGGCCGA TCTCGACAAC 
GCCGGCGAGC CGGGCTTCTC GCTGTTTGGC CGCAAGCCCA AGGGCCTGAA GGGCGTCTAT 
CTGTGGGGGC CGGTCGGGCG CGGCAAGTCC ATGCTGATGG ACCTGTTCTT CGACAGCGCT 
CCGGTGGCCA AGAAGCGCCG CGCGCACTTC CACGCCTTCA TGGCCGAGGT CCACGAGCAC 
ATCAACGCCT GGCGCAAGGG CGACGCGGCC GAACGCAAGG CGCGCTTTGG CCAGCACAAG 
GGCGACGATC CGATCGTCCC CACCGCCGAC CTGATCGCCG CCGACGCCCG CCTGCTGTGC 
TTCGACGAGT TGCAGGTCAC CGACATAGCC GACGCCATGA TCCTGGGCCG GTTGTTCGAG 
GCGCTGTTCG CCCAGGGCGT GACCCTGGTG GCCACGTCGA ACCGTCCGCC CGATGATCTC 
TACAAGGACG GCCTCAATCG CCAGCTGTTC GTTCCCTTCA TCGCGATGCT GAAGGAGAAG 
ATGGACGTGG TGTCCATACG CGGGCCGGTC GACTTCCGGC TTGACCGGCT ACGGGCCGCC 
CGTACCTGGC TGGCGCCGGA CGACAAGGTC AACGCCGCGG CGTTCGACCG ATTGTGGGCC 
GAAATGCTGG ACGGCGCCGA GGAGACCGGG GCCAAGATCG AGGTGCTGGG CCGCAGGATG 
CACTTCCCGC GCGCCGCCGG CGGCCTGCTG CGCGCCTCGT TCGCCAGCCT CTGTCAGCAA 
GCCTTGGGAC CTCAGGACTA TCTGGCGATC GCCGAGCGCT TCCACACCCT GTTCCTGGAG 
GACGTGCCGC TGCTGACGCC GGACCGGCGC GACGCGGCCA AGCGCTTCAA CACCCTGATC 
GACGCCCTCT ACGAGGCCGA CGCCAAGCTG GTGGCCCTGG CCCACGGCGA GCCCGAGGGG 
CTGTACCCGG CCGGCGACGG CGCGTTCGAG TTCGAGCGCA CGGTGTCGCG CCTGCAGGAA 
ATGCGCTCGG CCGACTATGT CGCCAAGGTC AGGGACTAG

Protein sequence

MPTSVRTAYR ERLAQGEIKP DAAQAAAVDA LSRLEADLDN AGEPGFSLFG RKPKGLKGVY 
LWGPVGRGKS MLMDLFFDSA PVAKKRRAHF HAFMAEVHEH INAWRKGDAA ERKARFGQHK 
GDDPIVPTAD LIAADARLLC FDELQVTDIA DAMILGRLFE ALFAQGVTLV ATSNRPPDDL 
YKDGLNRQLF VPFIAMLKEK MDVVSIRGPV DFRLDRLRAA RTWLAPDDKV NAAAFDRLWA 
EMLDGAEETG AKIEVLGRRM HFPRAAGGLL RASFASLCQQ ALGPQDYLAI AERFHTLFLE 
DVPLLTPDRR DAAKRFNTLI DALYEADAKL VALAHGEPEG LYPAGDGAFE FERTVSRLQE 
MRSADYVAKV RD