Gene Meso_3643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Meso_3643
Symbol
ID	4181990
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chelativorans sp. BNC1
Kingdom	Bacteria
Replicon accession	NC_008254
Strand	-
Start bp	3935132
End bp	3936733
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	61%
IMG OID	638069537
Product	twin-arginine translocation pathway signal
Protein accession	YP_676177
Protein GI	110635969
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.166369
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACTCT CGAGACGAGG ATTTTTGTGC CGCTCCGCCG CCGCAGGCGC CCTTCTTTCC 
ATGCCGCTCA AGGCGTTCGC CCAGTCGGGA GAAATGGGCA TGCTGCGAGT GGCGGTTTAC 
ACGGACATGG TGGGTTACGA CCCGATCGTG ACCACGTCGA ACATCGCGGC CTATCATGGT 
GCGCTCGTGT ACGACATGCT TTTCGGCAAC GATGAAAACC AGATGCCGCA TCCACAAATG 
GTCGGCGACT ACACGATATC CGAGGACAAG CTGACCTGGA CGATGACGCT GCGAGACGGT 
CTGACCTTCT CCGACGGCAG CCCTGTGACG ACGGCCGACG TGATACCATC CATCCTGCGC 
TGGCAGGCGC GTGCCAGCCA GAACGGCAAG CTGCTGGCGG CGGCTACGCA GGAGCTGGTG 
GCCTTGGACG ACCGCACCTT CCAATTCAAG CTCAAGGAGC CGTTCCCGTT GTTGGCGGCA 
ATGCTGGGCA GCCCGGCAAC GCCACTGTGC TTCATCATGC GCAAGCGCGA GGCGGAAATG 
GATCCGGCTC AGGCGGTCGA CGTCTGCATC GGCTCCGGCC CCTATGTGCT CAACACGCAG 
GAAACCCGTC CAGGTATCGA CTACGTTTAC GATCGTAATC CGAACTATGT GCCCCGCGAG 
GAGCCCGCGA GCGGGCTTTC GGGCGCCAAG ATTGCGAATT TCGAGCGCGT CATTCTGGTG 
AACATGCCGG ACGCTCAAAC TGCGATCGCG GCGCTGCAGG CCGGTGAGAT CGACTTCTAC 
GAAATTCCGC CGATCGATTT CCTCCCCGTT CTGGAAAGCG ATTCAAATCT CAAGGTCGCC 
GACATCATGA AGTCCGGCAC CGAGGGCTCC ATCATTCTCA ACTGGCTGCA GCCGCCCTTC 
GATAACCTGA AGGTGCGGCA GGCCATGCTG TATGCCATTG ACCAGGAGGC GGTCCTGAAG 
GGCCTCTTCG GCGATCCGAA CTGGTTTAAC GCGCATCCGA GCTGGTTCAC CTACGGTTCG 
CCGCTTTACA ACGAAGCGAA CTCCGAGTGG TTCAGGATAG CGCCGGATCC GGAGAAGGCG 
AAGCAACTGC TGGCCGAGGG CGGCTACGAC GGAACCCCGG TCGTGCTTCT CCAGGCGACC 
GACCGCCAGG TCAATGCCGA CGCCGTGACA ATCATCGCGC AGCAGATGCG GGCGGCCGGC 
TTCAACGTGC AGATCGACGC CATCGACTGG GCGACTCTGC TGCAGCGCAG GCCGAACAAG 
GGACCGGTTT CGGAGGGCGG CTGGAATGCC TTCGTCTCCA CCTTCAACGG CTTTATAAGC 
TCGAACCCCT ACACATTCGG TCACATGGCC ACGATCGGGG AGAACGGGTG GTTCGGATGG 
CCTTCGGACG AACGCAACGA GGAACTGAAG GCCGCCTGGA TGAAGGCCGA AACGCCTGAG 
GAGCGGGTGG CGATTGCGGC GGAAATCCAG GAGAACGCCT GGAATATCGT GCCGCGCGTA 
TCCTACGGGC ATTGGGTGCA ACCGGTCGCA TATCGCAGCA ACCTGGACGG CTTCGTTAGC 
ATTCCCGGCG TACTTGCCTT CTGGAACGTC AAGCGAGTCT GA

Protein sequence

MTLSRRGFLC RSAAAGALLS MPLKAFAQSG EMGMLRVAVY TDMVGYDPIV TTSNIAAYHG 
ALVYDMLFGN DENQMPHPQM VGDYTISEDK LTWTMTLRDG LTFSDGSPVT TADVIPSILR 
WQARASQNGK LLAAATQELV ALDDRTFQFK LKEPFPLLAA MLGSPATPLC FIMRKREAEM 
DPAQAVDVCI GSGPYVLNTQ ETRPGIDYVY DRNPNYVPRE EPASGLSGAK IANFERVILV 
NMPDAQTAIA ALQAGEIDFY EIPPIDFLPV LESDSNLKVA DIMKSGTEGS IILNWLQPPF 
DNLKVRQAML YAIDQEAVLK GLFGDPNWFN AHPSWFTYGS PLYNEANSEW FRIAPDPEKA 
KQLLAEGGYD GTPVVLLQAT DRQVNADAVT IIAQQMRAAG FNVQIDAIDW ATLLQRRPNK 
GPVSEGGWNA FVSTFNGFIS SNPYTFGHMA TIGENGWFGW PSDERNEELK AAWMKAETPE 
ERVAIAAEIQ ENAWNIVPRV SYGHWVQPVA YRSNLDGFVS IPGVLAFWNV KRV