Gene Caul_3940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3940
Symbol
ID	5901402
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4262541
End bp	4263923
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	70%
IMG OID	641564461
Product	amino acid permease-associated region
Protein accession	YP_001685563
Protein GI	167647900
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.447116
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGAGA CCCCCCAGAA GGTCCCGATC CCCAAGATCG TCGCCCCCAA GGCCCCCACC 
TCGCGGGAAT TGGGCTTCTG GATGTGCACG GCCCTGGTGG TCGGCAACAT GATCGGCTCG 
GGGGTGTTCA TGCTGCCCGC GTCCCTGGCC CCCTACGGCT GGAACGCGGT GTTCGGCTGG 
TTGGTGACCA TCGCCGGCGG CGTGGCCCTG GCCTTCGTGT TCGCGGGGCT GGCGCGCGAG 
TTTCCCAAGG CCGGCGGACC CTACGCCTAT ACGCACGAGG CCTTCGGGCC GCTGGTCGGC 
TTCATGGTGG CCTGGAGCTA CTGGATCTCG CTGTGGGTCG GCAACGCCGC CATCGCCACC 
GGGGCGGTCA GCTATCTGTC GGTGATCTTC CCAGCCATCG CCAAGGTTCC GGGGATGCAC 
CTGCTGGTCA CGCTTGGCTC GGTGTGGCTG ATGGTCGGGA TCAATATCGT CGGCGCCCGG 
CTGGCGGGCC GGGTGCAGCT GGTGACCACC GTGCTCAAGC TGATGCCGCT GGTCGCCGTG 
GCCGGCCTGG CCTTCTGGGT GATCGGCCGC GACCACGGGG CCAGCCTGAC CCCGTTCCGG 
GCCGCCGACA TCCGTCCGGG CGGCGTCACC GCCTCCGCCG CCCTGACCCT GTGGGCGCTG 
CTGGGCCTGG AATCGGCCAC CGTGCCGGCC GGCAAGGTGC ACGACCCGGT CCGCACCATC 
CCCCGCGCCA CCCTGGTGGG CACGATCTTC ACCGGCCTGG TCTATCTGCT GGTCTGCTCG 
GCGGTGGTGC TGCTGACGCC CACCGACGCC CTGAAGGTCT CCAACGCCCC GCTGTCGGAC 
TTCGTGGCCC TCCACTGGGG CGGTTCGGCC GGCAAGGTCC TGGCCCTGTT CGCGGCGATC 
AGCGCCTTCG GAGCCCTGAA CGGCTGGGTG CTGCTGCAGG GCGAAATGCC CTACGCCATG 
GCCAAGGGCG GGGTGTTTCC GGCCTTCCTG GCCAAGGAGT CGGTGCGCGG CGCGCCGGTT 
CGCGCCCACC TGCTGTCGGC CGGCTTCCTC ACCGTCCTGG TGCTGATGAA CTACGCCAAG 
TCGATGGCGG ACCTCTTCAC CTTCATCGCC CTGGTGGCGA CCACGGCGTC CTTGTTCGCC 
TACCTGGCCT GCGCCCTGGC GGCGCTGAAG CTGCAGAGCA CCGGGCGGAT CGCCCCGGCC 
AGGACCCTGA CCGTGGTCGC CATCCTGGCC GGCCTCTACG CGGCCTTCAC CCTGGTGGGG 
GCCGGCGGCA AGGCGGTGGC CCTGGGCGTC GGCCTGCTGG CGATCGGCGC GCCGTTCTAC 
TGGCTGACGC GGGGCAAACC CCTCGCTGCC GTGCATCCCG GTGATCATCG GGACCCAAGC 
TGA

Protein sequence

MTETPQKVPI PKIVAPKAPT SRELGFWMCT ALVVGNMIGS GVFMLPASLA PYGWNAVFGW 
LVTIAGGVAL AFVFAGLARE FPKAGGPYAY THEAFGPLVG FMVAWSYWIS LWVGNAAIAT 
GAVSYLSVIF PAIAKVPGMH LLVTLGSVWL MVGINIVGAR LAGRVQLVTT VLKLMPLVAV 
AGLAFWVIGR DHGASLTPFR AADIRPGGVT ASAALTLWAL LGLESATVPA GKVHDPVRTI 
PRATLVGTIF TGLVYLLVCS AVVLLTPTDA LKVSNAPLSD FVALHWGGSA GKVLALFAAI 
SAFGALNGWV LLQGEMPYAM AKGGVFPAFL AKESVRGAPV RAHLLSAGFL TVLVLMNYAK 
SMADLFTFIA LVATTASLFA YLACALAALK LQSTGRIAPA RTLTVVAILA GLYAAFTLVG 
AGGKAVALGV GLLAIGAPFY WLTRGKPLAA VHPGDHRDPS