Gene Caul_0619 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0619
Symbol
ID	5898074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	682588
End bp	684327
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	71%
IMG OID	641561101
Product	hypothetical protein
Protein accession	YP_001682250
Protein GI	167644587
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTTGG CATCATCATC GGCCGTTAGA ACCGCGACGT TCGCGTCGTC GGGGACGTCG 
GCGATCGGCG ATCGTCTGGA AGCCGCCCGC GCGGCCATCG AAGGCCGGTT CCTGGAAGCC 
GGCGACGTCC TGTCGCGAGC CCTCGACGGC GTGGCCGCCC TGGTCTCCGC CCTCGACCGC 
ATGGGCCAGA ACCTCGACGC CGACACGGCC CGCAAGACGA CCGCCGAGCT GGCGAAGGCC 
GCCGACACCC TGCGCGGCCT GCCCCGCAGC CTGGACGCGC GCCGCGGTCA GGTGGGCGAC 
CTGGTCAAGG TCGGCGACGT CCTCACCACC TGCATCGAGG AGATGCGCCA GCACCTGGCC 
TATCTCAGGG TCTTCGCCAT CAACATCAAG ATCACCTCCG GCGGCATCGT CGCGGCGGGA 
CCTGAGTTCG CGATCTTCGC CCAGGAAATC TGCGACGTGA TCGAGTTGGG ACGAACCCAG 
CTGGACACCT TCCGCGGCGA CCTCCTGACC CTCGACGGCG CGCTGCGCGC CGCCCTCGTC 
CACGAGGACG GCCTGGCCCG CCATTGCGCC GACCTGCTGC CGGCGGTGCC CGACGCTCTG 
ATCGGCAGCG CCAACGCCAT CGCGGCCCAT CACGGCAAGA TCGCCGAGGT CGCGGTCAGC 
GTCGCCGCCC TGGCTCGCGA CGTCCAGAAG AAGGTCGGCG GCGGCCTCGC GGCCCTGCAG 
ATCGGCGACA TCACCCGCCA GCGGATCGAA CACGTCCAGG CCGGCCTGGC CCTGTTGGAC 
GCCAAGACGC CCGGCCTGAC GGCCGAGCAG GGCGAGCGGC TCGAAGCCTT CATCCACCGC 
CTGCTGGCGG CTCAGCTGGC CGCGACGGCC GCCGACTTCC ATCGCGACGT GTCGCGGATC 
GCGGCGAACG TCGCGGGCAT GGCCGCCGAC GCCGGCGAGA TGCTGCGGCT GCGCGACCTC 
GCCTATGGCC AGAGCCAGGG CGCCGAGGGC GGCTTCCTGC GCGGCCTGGA GAACCATGTG 
GGCCAGGCGC TTGGCCTGGT CGCCGATATC GACGCCGGCG AACAGGCGGC GCGCGACGTC 
AGCCGTTCGG CGGCCGAGGC GGCGCACGAC CTGACCGATC AGATCGGCGG CATCCAGACC 
ATGCGCGCCG ACGTCCAGAT GATGGCCCTC AACACCACGC TGAAGTGCAG CCGCATCGGC 
GAGACCGGCA AGCCGCTGGC GGTAATCGCC GTCGAACTGC GGCAACAGGC CATTCACCTG 
GAGAAATCGG CCGCGCGCAC CCTGGACTCG CTGAACGCCC TGTCCGTCGC GGCGGCGGCG 
AGCGACCCCA GGGCGTCCGT TGAAGGCGGC GGCGAGGCGG CTGCGGCGGC GGGCGTCCTC 
AGCGACGCCG CCGCGCGCAT TCACCGCGCC GGCGACGGCG CGGAAAGCGA CCTGGCCGAG 
GCCGCTCGCC AGGGCGCCGA GGTGGTCGAC ATGCTGCAAC GGGCCGCCGG CCGCTTCGAT 
TTCCAGCGCC AGATCGGCTC CGTCCTCGAC GAGGCCGCCG ACGCGCTGTG GGCTCAAGCC 
GGTGACGACG ACATCGCCAC CGACGACATC GGCCCGACGC TACGGCCGAT GATGGATCGG 
CTGTTCAAGA CCTACACCAT GGCCCAGGAA CGTGACGTGC ACCGCGCCAT GATCGAGACC 
CTGGGTGAAG CCGCCTCGGA AGCGCCGGCG GCGGAAGATC CGGACGACGT CCTGTTCTAG

Protein sequence

MSLASSSAVR TATFASSGTS AIGDRLEAAR AAIEGRFLEA GDVLSRALDG VAALVSALDR 
MGQNLDADTA RKTTAELAKA ADTLRGLPRS LDARRGQVGD LVKVGDVLTT CIEEMRQHLA 
YLRVFAINIK ITSGGIVAAG PEFAIFAQEI CDVIELGRTQ LDTFRGDLLT LDGALRAALV 
HEDGLARHCA DLLPAVPDAL IGSANAIAAH HGKIAEVAVS VAALARDVQK KVGGGLAALQ 
IGDITRQRIE HVQAGLALLD AKTPGLTAEQ GERLEAFIHR LLAAQLAATA ADFHRDVSRI 
AANVAGMAAD AGEMLRLRDL AYGQSQGAEG GFLRGLENHV GQALGLVADI DAGEQAARDV 
SRSAAEAAHD LTDQIGGIQT MRADVQMMAL NTTLKCSRIG ETGKPLAVIA VELRQQAIHL 
EKSAARTLDS LNALSVAAAA SDPRASVEGG GEAAAAAGVL SDAAARIHRA GDGAESDLAE 
AARQGAEVVD MLQRAAGRFD FQRQIGSVLD EAADALWAQA GDDDIATDDI GPTLRPMMDR 
LFKTYTMAQE RDVHRAMIET LGEAASEAPA AEDPDDVLF