Gene Caul_2950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2950
Symbol
ID	5900405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3200527
End bp	3201867
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	69%
IMG OID	641563447
Product	amino acid permease-associated region
Protein accession	YP_001684575
Protein GI	167646912
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.534787
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGCC ACGCCGACAT CCTGTTTTAC GTCAGTGTCG GGGCCGGCAT GGCCCTGGCG 
ACCAGCGTGT TCACGATGAT CGGCGGCCTG TTCGCGGTGG CCAGCCTGCC GTGGATCGTG 
ACGGGCGTCG TGCTGGCGGG ACTGTTCTGC GGCGCGATCT CGCTGTCGAT CGGCGAGCTG 
GCCAGCCTCT ATCCCTCGGC GCCCGGCATC CGCACCTATT TCAAGGCGGC GTTCGGCGAG 
TTCCCGTCGC TGGTGGCCAT CTATCTGTAC CTGGCCTTCG CGATCATCGT CGCGGGCCTC 
GAAAGCTTCG TGTTCGCCAG CGTTGTCGGG ATGGTGGCGC CAGACTGGCC CAGGGAGGCC 
ACGGTCCTGG TGCTGCTGCT GGTGGTGGTC GGCACCAACC TGGCCGGCTT CCAACTGCCG 
CGCGGCCTGC AGATCGGCTC GACCGTCGGG GCGGTGGGCC TGGTGCTGGT CGCGGCGGTC 
TGGGCGCTGG CGCGGAACGG ATCGGCGCCG CATCCGCTCT CCCCGCCCCT CGCCGGATCG 
CTCGCCCAGC TGCCGGCCCT GGTCGGGATG AGCATTTTCC TGTTCACCGG CTTTGAATGG 
GTGACGCCGC TGGGCCTCAA GCCCTCGGCC TACAAGATGC AGATCCCGGT CTCGATGCTG 
CTGGGGCTGC TGGTGCTGAC CCTGACCTAT GTGCTGTTCA CCCTGGGCGC GGCGGCCCAG 
GTCCCGGCGA CCTCCCTGGC CGGCGCCCTG GCGCCGCAGG TGGCGCTGTT TCGGCAGATC 
TATGGCGAAG TCGGGCTCTA TGTCGGCCTG GCACTGTCGG TGCTGGCGAT CTTCTCGACC 
TTCAACGCCG GCATTCTCGG TGGCGCGCAG TTGATCTACC TGCTCGGCCG CGAAGGTGCC 
CTGCCCCCGT GGCTGGCGGT GATGTCGCCG CGCACCGCGA CGCCGACCGG GGCGATCCTG 
CTGCTCGGAT CGCTGGCCAG CGTCTCGGCG ATCATCGTCC TGACCTTCAG GCTGGAGATC 
ACCGCCGCCC TGGTCGGCGC CACCATCATG TGCGCGGTCT ATAGCGGCTT CGTCGCCTGC 
GGCCTGCGGC TGAAGACCAG GCCCGCCGCG CCGGGTCGCC GGTTCACCAA CCCGCTGCCG 
GCCTGGGCGC AGATCCTGCT GGTCCCAGTG TTGCTGATCG TCGGCGTCCA GACCCTGTTC 
TCGGAGCCCA AGACCACGGT CTCCGCCCTG GTCGGCCTCG CCGTGGTGCT GGCCATCGCC 
TGCCTGCTGG CGACCTATTC GACCTCGCTG CGCGCTGGCG AGCGCCGGGC CGCCACGGCC 
ATGCCCCGGA GGGTCGAATG A

Protein sequence

MKRHADILFY VSVGAGMALA TSVFTMIGGL FAVASLPWIV TGVVLAGLFC GAISLSIGEL 
ASLYPSAPGI RTYFKAAFGE FPSLVAIYLY LAFAIIVAGL ESFVFASVVG MVAPDWPREA 
TVLVLLLVVV GTNLAGFQLP RGLQIGSTVG AVGLVLVAAV WALARNGSAP HPLSPPLAGS 
LAQLPALVGM SIFLFTGFEW VTPLGLKPSA YKMQIPVSML LGLLVLTLTY VLFTLGAAAQ 
VPATSLAGAL APQVALFRQI YGEVGLYVGL ALSVLAIFST FNAGILGGAQ LIYLLGREGA 
LPPWLAVMSP RTATPTGAIL LLGSLASVSA IIVLTFRLEI TAALVGATIM CAVYSGFVAC 
GLRLKTRPAA PGRRFTNPLP AWAQILLVPV LLIVGVQTLF SEPKTTVSAL VGLAVVLAIA 
CLLATYSTSL RAGERRAATA MPRRVE