Gene Caul_5252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5252
Symbol
ID	5897264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	+
Start bp	184789
End bp	186120
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	68%
IMG OID	641555355
Product	amino acid permease-associated region
Protein accession	YP_001676686
Protein GI	167621901
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1113] Gamma-aminobutyrate permease and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.38319
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGCCGC CGGCTGGGCT GCGCGAGCGC CACATCCGCT TCATTGCGCT GGGCGGGGCC 
ATAGGCGCGG GACTGTTTCT CGGCTCGGGC GCGGCGCTGC ATAGCGCCGG CCCCACCTTG 
CTGGCGGCCT ACGCCGCCAG CGGCCTGGCC GTTTTCATGA TCTGCCGCGC CATGGGAGAG 
CTGATCCTGG CCCGTCCGTC GCCGGGCGCC TTCGCAGACT ACGCGACCGA CTTCATCGGC 
CCCTGGGCGG GCTATTTCAC CGGCTGGTCC TATTGGTTGA TCTGGATGCT CGCCGGCATC 
GCCGAGATCA CCGCCGCCGG CGTGTTCATG CGCTTTTGGT TTCCTGACCT GCCGCAATGG 
GTCACGGCCC TGTGCGCGGT CGCTGTGCTC GGAGCGGTGA ACCTGACCTC GACGCGACTG 
TTTGGCGAAC TCGAGTTCTG GCTGGTGTTG GTCAAGGTTT TGACGGTCAT CGCCCTAATC 
CTTGGCGGAG CCTTCATTCT CCTGACCGGA TTTCACCGCC CGCCGCAGGC CGGGCCGGCG 
ACCCTGATCG TCGGCGGATT ATTGCCCCAT GGCTGGGGCG GTCTTCTCCA TGCCCTGCCG 
ATCGCGATCT TCGGTTTTGG CGGCGTGGAG ATGATCGGCC TGGCCGTTCA GGACGGCGCC 
GACCCCCGCC GCTCCGCCCC GAAGGTCATC AACGGGGTCA TCTGGCGAAT TCTGGTCTTC 
TACATCGGCG CCCTGGCGGT CATCATGATG ATCTTTCCCT GGACCCAGCT GGATCCGCGC 
CAAAGCCCCT TCGTCGCGGT CTTCGCGAGC CTAGGCCTGC CGGCAGCGGC GGGCGTGATC 
AACGCCGTAG TCCTCACCGC GGCGCTGTCC AGTTGCAACA GCGGCCTCTA CTCCGCCAGC 
CGCATGCTGG CCGCTCTGGC GCGGCAAGGC CAGGCGCCGT CGTCGCTGGC CGCCCGCGCC 
GACCATCGGG TTCCCACGCG CGCCGTCCTG GTTTCGATAG CAGGTCTCGG ACTTGGCGTG 
GCCCTCAACT ACGCCCTGCC CGACCGCGCG TTCGGCTATC TCGTCAGCGC CCTGGCCGCG 
CTAATCCTGT GGATCTGGGG CGTGATCCTG GTATCGCACC TTCGATATCG CCGCCGCCTT 
GCCGCCTTGG GCCAAGCGCC CGGCGCCTTC GCCATGCCGG GCGGCGTCGG GGCGAACGTC 
GCCACGCTTG GCTTTCTGGT GCTCGTGGCG GCGATCCTGG CGCTCGATCC GGCCAGCCAG 
ATGATCTTCG CCATCGCCGC GGGCTGGTTC GCCCTGCTGG CGATCATCTA TCGGCTGACC 
AGGCCGCGCT AG

Protein sequence

MRPPAGLRER HIRFIALGGA IGAGLFLGSG AALHSAGPTL LAAYAASGLA VFMICRAMGE 
LILARPSPGA FADYATDFIG PWAGYFTGWS YWLIWMLAGI AEITAAGVFM RFWFPDLPQW 
VTALCAVAVL GAVNLTSTRL FGELEFWLVL VKVLTVIALI LGGAFILLTG FHRPPQAGPA 
TLIVGGLLPH GWGGLLHALP IAIFGFGGVE MIGLAVQDGA DPRRSAPKVI NGVIWRILVF 
YIGALAVIMM IFPWTQLDPR QSPFVAVFAS LGLPAAAGVI NAVVLTAALS SCNSGLYSAS 
RMLAALARQG QAPSSLAARA DHRVPTRAVL VSIAGLGLGV ALNYALPDRA FGYLVSALAA 
LILWIWGVIL VSHLRYRRRL AALGQAPGAF AMPGGVGANV ATLGFLVLVA AILALDPASQ 
MIFAIAAGWF ALLAIIYRLT RPR