Gene Namu_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1037
Symbol
ID	8446633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	1145460
End bp	1146959
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	67%
IMG OID	645040175
Product	citrate/H+ symporter, CitMHS family
Protein accession	YP_003200434
Protein GI	258651278
COG category	[C] Energy production and conversion
COG ID	[COG2851] H+/citrate symporter
TIGRFAM ID	[TIGR00784] citrate transporter, CitMHS family

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCATCG CCCTCGGCTG CGTGATGATC GCAGTCTTCA TGTACTTGAT TCTGAGTAAG 
AGAATCGTAC CGGTGATCGC ACTGATTCTG GTGCCGATCA CCATGGGCCT GGTTGCGACC 
GGGACCGGAA TTGCCGAAGA CGTTGAGGGC GGCGTCACCG GCGCCATCAT GAAGGCCGTC 
AAGGACTTCG CGCCGACCGC GGCGCTGCTG TTCTTCGCCA TCATCTACTT CGGCCTGATG 
ATCGACGTGG GCCTGTTCGA TCCGCTGATC CGCTTCATCC TGCGGGTGGT CGGCAACAGC 
CCGGTGAAGG TCGTCCTGGG CACCGCCCTG CTGGCCGGTG CGGTCTCCCT GGACGGCGAC 
GGCTCCACCA CCTTCATCAT CACCGTCTCG GCCCTGCTGC CGATCTACCG CCGGCTGGGA 
ATGAGCCCGG TCGTGCTCTG CGTGGTCGCC AACCTGGCCA ACGGGGTGCT CAACATCGTG 
CCCTGGGGCG GCCCGACGAT CCGGGCCGCG ACGGTGCTGA ACGTCTCGCC CTCCGAACTG 
TTCAACCCGA TGGTGCCGGG CATGATCATG GGCATCCTCA CCGTCTTCGT GTTGGCCTAC 
TTCCTGGGCC GGAGCGAGAA GAAGCGTCTG CTCAAGTCGG GGGCGACCCT GGAGACGGTG 
GCGGCCGAGC TGCGTGGCGG CTCCGGCGGG GGTACCGGCA CCGCGGTGCT GACCGGCCCC 
GGCGCCGGTG GCGGCACCGG CACGACCACC GGGGGCGACT TCCCGCCGGT CCCGCCGGCC 
AACCTGAACC TGTCCTCGAT CGCCCGCTCC GAGCTGGGCG TCACCGACAA CGACGAGCAC 
TCCGACATGG AGGACGGCCT CGATCCGAAC CGGAAGACCC TGCGGCCCAA GCTGATCTGG 
TTCAACCTGG CGCTGACCGT CGGCCTGCTG GTCTGCCTCG GGCTGGACAA GCTGCCTTTG 
GCCCTGGTGT TCATGGTTGC CGCCGCGGTC GCGCTGGTGG TCAACTTCCC GCAGCAGAAG 
GATCAGGCCG ACCGGATCAC CGCGCACGCC ACCTCCATCG TCTCGGTGGT CGCCATGGTG 
TTCGCCGCCG CGGTACTGGT GGGTGTGCTC TCCGGCACCG GCATGGTGAC CGCGATGGCC 
AACGGCATCG TCTCCGCCGT CCCGGAACCG CTGGGTCCGT ACTTCGCCGT GATCACCGCG 
ATCCTGTCCA TGCCGCTGAC GTTCTTCCTG ACCAACGACG CGTTCTACTT CGGCATCCTG 
CCGATCCTGT CGCAGGCCGC CGGTCACTAC GGGATCTCCC CGGTGGAGAT GGCGCAGGCG 
TCGATCATCG GCCAGCCGGT GCACATGACC AGCCCGCTGG TCCCGGCCAT GTTGCTGCTG 
ATCTCGCTGG CTCGGGTGCA GATGGCCGAC CATCACAAGA AGGTCATCTG GCGGGCCGTC 
GTCTGCTCGA TGGTCATGCT GGCCACGGCC CTGGTCCTGG GCGTCATCCC GGTCGGCTGA

Protein sequence

MLIALGCVMI AVFMYLILSK RIVPVIALIL VPITMGLVAT GTGIAEDVEG GVTGAIMKAV 
KDFAPTAALL FFAIIYFGLM IDVGLFDPLI RFILRVVGNS PVKVVLGTAL LAGAVSLDGD 
GSTTFIITVS ALLPIYRRLG MSPVVLCVVA NLANGVLNIV PWGGPTIRAA TVLNVSPSEL 
FNPMVPGMIM GILTVFVLAY FLGRSEKKRL LKSGATLETV AAELRGGSGG GTGTAVLTGP 
GAGGGTGTTT GGDFPPVPPA NLNLSSIARS ELGVTDNDEH SDMEDGLDPN RKTLRPKLIW 
FNLALTVGLL VCLGLDKLPL ALVFMVAAAV ALVVNFPQQK DQADRITAHA TSIVSVVAMV 
FAAAVLVGVL SGTGMVTAMA NGIVSAVPEP LGPYFAVITA ILSMPLTFFL TNDAFYFGIL 
PILSQAAGHY GISPVEMAQA SIIGQPVHMT SPLVPAMLLL ISLARVQMAD HHKKVIWRAV 
VCSMVMLATA LVLGVIPVG