Gene Rleg_2814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_2814
Symbol
ID	8013754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	2797157
End bp	2798155
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	60%
IMG OID	644825385
Product	flagellin domain protein
Protein accession	YP_002976614
Protein GI	241205518
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTATTT ACCAGCGCGT CTCGGTGGAT GCGGCGCTTC ATGTGCTGCG CGATATCAAC 
CGTAATATGG CGGTCACGCA AAACCACATC ACGACCGGTA TGCGTGTGGC AAAAGCCAGC 
GACAATGCCG TCTATTGGTC GGTCGCCACC ACTGCGCGAA CCGACAACAA GGCGGTTTCG 
GCGATCCAGG ATGCGCTTGG TATGGCGGCG GCGACGATGG GAACGGCCTA TACCGGCGTC 
CAGAACGTCA TCGATGTCGT CTCTGAGATC AAGGCCAAGC TGGTTGCCGC GACCGAAGAC 
GGGGTCGACA AGGACAAGGT CAATGAAGAG ATCAAGCAGT TGCAGGAGCA GTTGCGCAGC 
GTCTCCGAGG CGGCGACTTT CAATAGCGAC AACTGGGTGG TTCTCAACAA CGATGCGACA 
CCGACGCAGC CGCGCCAGAT TCCGGCCTCC TTCATCCGCA ATGCCGACGG GACCATCTCG 
GTCGGCATGC TGAGCTATCA TATCGACACG ACGCCGAGCG GGAGCACGAC CTCTAAGGAC 
GCACGCTACC TGATCGATGA TCGCGCCACC GGTTCGGGCG AATACGGCGT GCTGACATCG 
GCCTATTTCG CCACCGAGCT CGGCGCGTCG CAGGACTACG TGCTGATGCA GAGCAAAAAC 
GGCACCACCA CAGGGCAGGT AGTGATTTCG CTCTCGGCTA GCACGACGAA AGGACAGGTC 
GGCGAAATGA TCAGCGTCGT CGATGCCGCG CTGTCGCAGC TGACGACGGT CGGTTCGGCC 
TTCGGCGCGT TGGAGAAACG CATCAACCTG CAGAACGACT TCGCCACGAA ACTGCACGAC 
AACAATGCCA CCGGCATCGG CCGGCTTGTC GATGCCGACA TGGAGGAGGA GTCGAGCAGG 
CTCAGGGCGC TGCAGACGCA GCAGCAACTC GGCCTGCAAT CGCTGAACAT CGCCAACGCA 
ACCTACGATA CGGTGCGGCA GTTGTTCCAA AATTTCTAA

Protein sequence

MSIYQRVSVD AALHVLRDIN RNMAVTQNHI TTGMRVAKAS DNAVYWSVAT TARTDNKAVS 
AIQDALGMAA ATMGTAYTGV QNVIDVVSEI KAKLVAATED GVDKDKVNEE IKQLQEQLRS 
VSEAATFNSD NWVVLNNDAT PTQPRQIPAS FIRNADGTIS VGMLSYHIDT TPSGSTTSKD 
ARYLIDDRAT GSGEYGVLTS AYFATELGAS QDYVLMQSKN GTTTGQVVIS LSASTTKGQV 
GEMISVVDAA LSQLTTVGSA FGALEKRINL QNDFATKLHD NNATGIGRLV DADMEEESSR 
LRALQTQQQL GLQSLNIANA TYDTVRQLFQ NF